- 1、本文档共110页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网信息内容管理若干技术研究-电路与系统专业论文
摘
摘 要
I
I
摘 要
国际互联网作为一个全球性的信息资源网络,正在对经济、政治、文化、科 技、军事等各个领域产生重大影响,深刻改变着人们的生产、工作和生活方式, 对推动经济发展和社会进步起到了积极作用。同时巨大的开放信息源也使一些 恶意的和不良的 (反动、色情等)信息内容趁机而入,成为用户获取有效信息的 严重障碍。世界各国对互联网治理工作越来越重视,研究开发智能、高效、实 用的互联网信息内容管理技术是一项十分重要的课题。
本文综合运用粗糙集理论、机器学习、模式识别、数据挖掘、知识发现、 中文信息处理、人工智能等学科的相关知识,通过分析各类不良信息的特征, 结合现有的一些成熟先进的文本信息处理方法,深入研究了适合不良文本信息 过滤的模型、文本预处理技术、文本特征选择技术、过滤算法以及相关应用等, 设计实现了一个电信级网络信息内容监控系统。
本文所做的主要工作如下: 1.分析了国内外互联网内容管理技术发展现状;讨论了互联网信息内容管理 技术框架;研究了多种信息获取、信息内容的分析、加工和处理、互联网信息 内容服务等互联网信息内容管理相关关键技术
2.论述了信息抽取的概念,分析了信息抽取常用方法及发展趋势;分析了 多种不同类型的 Web 信息抽取算法;研究了数据密集型 Web 页面中自动提取结 构化数据并形成知识表示系统的问题。采用基于 PAT-array 的模式发现算法,结 合基于本体的关键词库自动识别页面数据显示结构模型,利用 XML 的对象-关 系映射技术,基于知识数据库实现动态页面获取、Web 数据自动抽取与知识数 据库的自动扩展。
3.阐述了信息过滤的概念,讨论了常用的文本过滤方法及文本过滤的评价 方法,研究了基于向量空间模型的文本过滤算法、基于概念的文本过滤模型、 基于语义分析的倾向性文本过滤模型、基于人工神经网络的文本过滤模型;最 后研究了粗糙集理论在信息过滤中的应用,设计了基于属性约简的信息过滤算 法。分析基于启发式信息的属性约简算法,指出属性依赖度的计算过于粗糙,
互联网信息内容管理若干技术研究
互联网信息内容管理若干技术研究
II
II
而基于信息熵的计算过于精细,将两者结合的加权平均的计算过于复杂。采用
近似分类精度进行属性重要性的度量,结合遗传算法,设计了一种属性约简算 法。该算法简单高效、鲁棒性强、适于并行处理,有良好的实用性。
4.讨论了电信级信息内容监控系统设计的需求,分析了电信级网络在线系 统的特点,给出了一个低成本实现电信级网络实时在线信息内容监控系统的总 体设计方案。设计了在线系统和非在线系统两级过滤系统的详细设计方案。该 系统不仅可以实现高速网络信息的实时过滤、识别,而且可以通过非实时系统 对互联网的各种应用进行监控管理,对热点话题和敏感事件、人物进行追踪, 实现舆情监测和预警。
关键词 信息内容管理,粗糙集,属性约简,文本过滤,特征选择,文本表 达,向量空间模型
Abs
Abstract
PAGE
PAGE 3
Abstract
As a global information resource network, Internet is making significant effect on various fields such as economy, polity, culture, science and technology, military, and etc, and greatly changing the way of produce, work and life of people. It has played a positive role in promoting the economic development and social progress. Whereas, the openness of the Internet made the malicious and bad information (reactive, erotic, etc) spread on the network and become a serious obstacle in users’ obtaining effective information. Internet control work has been getting more and more recognition of the countries all over the world. Research of intelligent, efficient and practical information content management technologies of Internet becom
您可能关注的文档
- 候选基因多态性与2型糖尿病易感性的关联研究-营养与食品卫生学专业论文.docx
- 基于android的运动检测视频监控应用的设计与实现-软件工程专业论文.docx
- 基于android的机载音视频实时传输方案设计与实现-信息与通信工程专业论文.docx
- 基因组数据的隐私保护技术研究-电子与通信工程专业论文.docx
- 基于ahp-模糊综合评价法的新型干法水泥生产安全评价研究-安全工程专业论文.docx
- 侯咏电影艺术研究-电影学专业论文.docx
- 华北克拉通北太行山中生代似埃达克火山岩的成因-矿物学、岩石学、矿床学专业论文.docx
- 基于android平台的隐私信息保护系统研究与实现-计算机技术专业论文.docx
- 基于armlinux系统的综合实验平台接口模块设计-测试计量技术及仪器专业论文.docx
- 华北落叶松天然种群的aflp与cpdna序列分析-生态学专业论文.docx
文档评论(0)