ROST反论文剽窃检测系统
武汉大学开发
ROST反剽窃包括三个部分:全网检索、本地文献库对比、少量文献内存对比。
目前将ROST反剽窃的全网检索的部分整合到了ROST CM内容挖掘系统 中的相似分析模块。在教育网由于网络环境问题,服务器连接有问题,建议在电信网中使用
更新日志:
ROST CM 5.8.0.595版,2011.02.14 update!
主要修复了微博分析、期刊分析、相似分析模块的一些Bug,增加了ROST DM模块,tool目录下ROST DM中,有使用手册
ROST CM 5.8.0.559版 2010.09.18 update!
0.增加了词性标注、语料标注工具
1.将ROST反剽窃系统6.8版整合到ROST CM中的相似分析中
2.增加了第三方工具,可以方便的把数据导出为ROST CM能处理的文本文件
3.修补了一些小Bug
ROST CM 5.8.0.484版 2010.08.27 update!
1.增加了一种全新的社会网络分析方法
2.在文本处理中增加了新浪评论采集功能,操作方法见http://hi.baidu.com/whusoft/blog/item/b210efc396f9855eb319a89f.html
3.在剪贴板中增加了获得选择复制的文件的文件名,点“粘名”即可。
4.修正了网友反映的一些小Bug
ROST CM 5.8.0.472版 2010.08.24 update!
0.修正了ROST WebSpider的一些缺陷,以及增加了链接下载的间隔时间设定,修正了新浪微博改版引发的Bug,以及其他一些小Bug
1.增加了TFIDF及批量词频统计功能
2.去除了社会网络分析中的一个瑕疵,在自定义文件菜单中增加了重载自定义表功能
3.增加了期刊分析测试模块
4.增加了聚类分析测试模块
5.在一般行处理中增加了删除空行的功能
ROST CM 5.8.0.450 2010.08.07 update!
1.增加了两个第三方的工具:RSS阅读数据采集器,FullTextSearch,增加了第三方工具菜单及子菜单,增加了更新列表、开放平台的链接
2.为Win7环境小幅调整了部分代码
3.为优化系统速度小幅调整了界面和代码
ROST CM 5.8.0.444 2010.08.05 update!
1.增加了微博分析,含微博备份和微博的实时搜索及分析的模块,记事本自动换行可以看到最后的效果
2.修改了社会网络分析中的一个Bug
3.小幅修改了数据目录菜单在大菜单中位置
4.在软件右下部增加了媒体报道
5.对数据在整个软件中的连贯性做了小幅优化
ROST CM 5.8.0.369版,2010.08.02 update!
1.整体调整了数据目录,全部放在程序的Data目录下面,共有四个子目录,对应剪贴板工具、浏览分析、全网分析和网站分析
2.对目标性分析的标签链接做了局部优化
3.增加了浏览分析模块
4.大幅度的优化了社会网络分析模块,其中增加了一种模式,在待处理文件中增加了已分词的(或多词一行的文本文件)生成社会网络模式,另外优化了NetDraw的显示方式,快速分析后,点击启动NetDraw,直接可以看到结果
5.在文本操作大菜单中增加了文本的替换与增补,其中有一个批量替换模式,在辅助词群中输入“新词 老词1,老词2,老词3”多行,选择第四项,词群替换即可。
6.增加了在线检测升级
7.去除了检测.NET Framework中的一个Bug
8.增加了查看分词和词频统计的自定义词表
9.优化了剪贴板监控工具
10.优化了批量文件处理工具
11.对文本操作的菜单作了小Bug去除和优化
ROST CM 5.8.0.176版 2010.7.27 update!
1.功能性分析菜单增加了英文词频统计功能
2.工具菜单增加了批量文件处理器
3.在目标性分析中增加了网站分析功能,并提供高级网站抓取,今后将进一步发布ROST DetailMiner(已开发完成,需调整界面)
4.增加了.NET Framewok的安装检测功能
5.修改了聊天记录的部分界面
6.修改了论文与资源的界面
7.在工具菜单中增加了网站抓取的保存位置的直达菜单
9.画了产品升级的界面
ROST CM 5.5.0.108版 2010.7.22 update!
1.功能性分析菜单中增加了社会网络分析、流量分析(需要.NET Framework支持)
2.目标性分析中增加了全网分析,由此打开通过搜索引擎分析互联网的一道大门。
3.修改了“论文与资源”模块
4.增加了文本操作大菜单,支持字段处理,一般性行处理,基于正则的特定信息抽取,基于字段特征的行处理,基于辅助词群的行处理
5.增加了工具菜单中的剪贴板监控器、域名排名快速查询器、文件格式批量转换器,以及快速到达程序目录等功能
ROST CM 5.5 2010.7.18 update!
1.功能性分析菜单中包括字频统计、分词、汉语词频统计、情感分析(需要.NET Framework支持)
2.目标性分析中包括QQ聊天记录分析
已知问题:汉语词频统计模块中的保留词表功能不正常