匿名不再:你的编程习惯出卖了你
时间:2015-01-29 16:57
来源:360安全播报
作者:秩名
点击:
来自美国德雷克塞尔大学、马里兰大学、哥廷根大学、以及普林斯顿大学的研究人员开发了一种“代码文体学(code stylometry)”,它可以利用自然语言处理及机器学习根据代码风格来识别源码作者。为了测试这个代码文体学的效果,研究人员收集了来自谷歌编程挑战赛(Code Jam)的公开数据。纵观250名多年编写代码的人员数据,在每个程序员平均630行的代码中,代码文体学识别匿名程序员的准确度为95%。而在一个由更少程序员(30名)、每人更多行代码(1900行)组成的数据集中,识别率达到97%。
(责任编辑:往生)