- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网媒体信息热点主动发现技术研究与应用.pdf
第 9 期 计 算 机 技 术 与 发 展 Vo1.19 No.5
2009年 5月 COMPUTERTECHNoLoGY AND DEVELOPMENT May 2009
互联网媒体信息热点主动发现技术研究与应用
黄宇栋,李 翔,林 祥
(上海交通大学 信息安全工程学院,上海 200240)
摘 要:网络媒体庞大的信息量及信息内容的各异,并不能把传媒聚类算法中适用于文本信息聚类的基本划分方法直接
应用于互联网媒体信息热点生动发现的研究工作中。鉴于此,文中将基于密度的聚类思想引入CFK—Means算法,创造性
地提出了全新的DCFK聚类算法。与此同时,文中基于DCFK算法构造大规模中文信息聚类模型,并且通过系列实验验
证本聚类模型在互联网媒体信息主动热点发现领域的有效性和实用性。
关键词:DCFK;大规模中文信息聚类;热点发现
中图分类号:TP301.6 文献标识码 :A 文章编号:1673—629X(2009)05一O001—04
Research andApplication onActiveDiscoveryTechniqueof
InternetM ediaInformationHotspots
HUANGYu—dong,LIXiang,LIN Xiang
(SchoolofInformationSecurity,ShanghaiJiaotongUniversity,Shanghai200240,China)
Abstract:AbundantinformationanddifferenceofInternetmediaCna ’tdirectlyapplythebasicdividedmethod,whichsuitthetextinfor·
marionclusterinmdeiaclusteralgorithm,toactivelydisocverthehotspotsofIntemetmdeiainformation.Sothat,pmlx~ethethen
clusteralgorithm callde DCFKbasedonCFK—Meansalgorithm.ItisnecessarytoconstructabundnatChineseinformationclustermodel
tOdiscovertheInternetinformationhotspots.Fina1ly.seriesofexperimentswillprovetheeffcetivenessandutilityofthem.
Keywords:DCFK:Chineseinformationcluster;hotspotdisocvery
O 引 言 类结果中包含巨量信息的类别正是需要寻找的互联网
随着互联网的快速发展 ,通过互联网获取信息、发 媒体信息热点Hj。因此高效、实用的互联网信息热点
布信息已经成为人们生活的重要组成部分,互联网媒 主动发现系统需要拥有能够高速处理大规模数据的信
体新发布信息很大程度反映当前社会各领域所关注的 息聚类算法,不过目前在面向互联网海量信息聚类方
热点、焦点。然而,在 “网络摩尔定律”的支配下,互联 面,暂未有成熟的核心算法与解决方案公开发表 2【J。
网信息量正以每 100天翻一番的速度增长。面对增长 传统的聚类方法主要包含基于划分方法、基于层
如此迅速的新网络信息,如何快速、有效地主动发现互 次方法、基于密度方法、基于网格方法和基于模型方法
联网热点信息已经成为一项紧迫而又重要的课题。 五种 J,每种聚类方法特点如下。
您可能关注的文档
- 二次回路异常引起全厂停电事故的分析.pdf
- 二氢杨梅素的稳定性及其影响因素.pdf
- 二氧化氯副产物的生成规律及其影响因素研究.pdf
- 二氧化氯及其测定方法的研究进展.pdf
- 二氧化氯发生率测定方法的研究.pdf
- 二氧化碳激光联合其他方法治疗尖锐湿疣疗效观察.pdf
- 二氧化钛溶胶的含量对耐磨涂层性能的影响.pdf
- 二氧化锰及相关锰氧化物的晶体结构_制备及放电性能_1_.pdf
- 二氧化锰的机械化学法制备及其性能.pdf
- 二氧化锰的研制及应用.pdf
- 2026版创新设计高考总复习地理中图版教师用-第58课时 交通运输与区域社会经济发展.docx
- 2026版创新设计高考总复习地理中图版教师用-第71课时 南水北调对区域发展的影响.docx
- 2026版创新设计高考总复习地理中图版教师用-第81课时 环境保护与国家安全.docx
- 2026版创新设计高考总复习地理中图版教师用-第77课时 海洋空间资源与国家安全.docx
- 2026版创新设计高考总复习地理中图版教师用-第72课时 黄河流域内部协作.docx
- 教育硕士考前冲刺练习含答案详解【达标题】.docx
- 教育硕士经典例题附答案详解【考试直接用】.docx
- 教育硕士综合提升测试卷附参考答案详解(完整版).docx
- 教育硕士题库附参考答案详解【黄金题型】.docx
- 教育硕士预测复习最新附答案详解.docx
最近下载
- 《质量评估流程》课件.ppt VIP
- 17J008 挡土墙(重力式、衡重式、悬臂式)(最新).pdf VIP
- 2024年数智工程师职业鉴定考试复习题库(含答案).docx VIP
- (完整版)建筑施工技术交底范本(大全) .pdf VIP
- 水运工程大体积混凝土温度裂缝控制技术规范_JTS-T 202-1-2022.pdf
- 设备供货、安装、调试、验收方案.docx VIP
- 《水利水电工程施工图审查技术导则》.pdf VIP
- 《木材学》——李坚 木材学笔记(完整).doc VIP
- 《公路水泥混凝土路面施工技术规范》_(JTGF30-2015).pdf VIP
- 小学生数学学习自查习惯现状调查报告.pdf VIP
文档评论(0)