- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于层次聚类的虚假用户检测-清华大学学报
( ) /
清华大学学报 自然科学版 年 第 卷 第 期
ISSN1000G0054 2017 57 6 1119
/ ( ), , ,
CN11G2223N JTsinhuaUniv SciTechnol 2017 Vol.57 No.6 620G624
g
基于层次聚类的虚假用户检测
, ,
方 勇 刘道胜 黄 诚
( , )
四川大学 电子信息学院 成都 610064
: ,
摘 要 互联网上充斥着大量恶意用户 而互联网服务提供
有一些用户却通过滥用互联网服务获取不正当的利
,
商通常有海量的注册用户 使得系统难以从中发现虚假账
. 、 、
益 这些恶意用户通过发布垃圾信息 虚假信息
. ,
户 针对海量注册数据中 恶意用户批量注册的虚假账户通 [ ]
13
钓鱼信息等方式扰乱互联网秩序 .当部分服务
.
常具有相似性的特点 该文提出海量数据中定位虚假账户
,
商建立新网站或者推出新业务时 服务商会在网上
,
的系统模型 利用用户名字符串组成模式对海量数据进行
.
进行一些促销返利活动以招揽顾客 恶意用户通过
, ,
预分类 进而对每个分类中元素计算字符串相似度 即计算
.
注册大量虚假账户直接获取经济利益 当这些Web
. ,
字符串Levenshtein距离 设置合适的阈值 进行层次聚类
,
服务提供商不再有促销活动时 这些虚假账户就变
, .
分析 从而定位藏匿在海量注册数据中的成组的虚假账户
您可能关注的文档
- 医院数据库审计与防统方系统参数指标-吉林中医药科学院.DOC
- 医疗费用电子化作业.PDF
- 医院医疗器材仓储风险管理.PPT
- 千博信息招聘简章.DOC
- 华东勘测设计研究院信息中心相关专业招聘简章-中国人民大学.PDF
- 华中农业大学经济管理一地管理-华中农业大学经济管理试验教学中心.DOC
- 华艺文献相似度检测服务操作手册.PDF
- 协同办公习题工作中心为管理部主管在系统中建立一个登录用户.DOC
- 单文档应用程序设计.PPT
- 单因子变异数分析表.PPT
- 基于属性—关系综合相似度的聚类算法-计算机应用研究.PDF
- 基于微博的用户相似度计算研究-计算机科学.PDF
- 基于改进编辑距离的字符串相似度求解算法-计算机工程.PDF
- 基于改进遗传算法的分布式电源并网优化配置-计算机工程与应用.PDF
- 基于时态数据库的极小子结构逻辑系统-计算机学报.PDF
- 基于树干解析的高山松天然林单木木材生物量生长模型-广东农业科学.PDF
- 基于模糊控制的自适应瓶颈带宽测量与定位采样方法-计算机应用与软件.PDF
- 基于消费支出比例的最低生活保障线研究-人口与经济.PDF
- 基于特征融合的社区问答问句相似度计算-江西师范大学学报.PDF
- 基于物联网的分布式能耗数据采集系统设计-自然科学版-广州大学.PDF
文档评论(0)