Kad网络文件名分类研究.doc
Kad网络节点资源探测分析?基金项目:本课题得到国家自然科学基金(No No.;国家高技术研究发展计划(863计划)(2006AA01Z452)的资助。
作者简介:刘祥涛,男,1977年生,博士研究生,研究方向:P2P网络安全,数据挖掘等,Email: liuxiangtao@. 龚才春,男,1978年生,博士,研究方向:信息检索,数据挖掘等. 刘悦,女,1971年生,副研究员,研究方向:信息检索,社区挖掘与分析,分布式计算等. 白硕,男,1956年生,博士,研究员,博士生导师,研究方向:自然语言处理,网络安全等.
刘祥涛1, 2,龚才春3,刘悦 1,白 硕1
1(中国科学院计算技术研究所 北京 100190)
2(中国科学院研究生院 北京 100190)
3(北京市计算中心 北京 100005)
摘 要 Kad网络中存在数以亿计的共享资源,而其中有相当一部分可被评定为敏感资源。首先用我们的Kad网络采集器:Rainbow对节点拥有的文件资源进行探测;然后对节点资源和敏感资源进行相关统计分析。我们发现:1)文件流行度和文件所对应的文件名数量都近似符合Zipf分布;2)利用同一个“文件内容哈希”(即file-content-hash)的多个文件名的共现词可以更准确地进行敏感判别;3)敏感资源占随机样本的6.34%,且敏感资源中7
原创力文档

文档评论(0)