数据挖掘英文论文数据挖掘的论文.docVIP

下载本文档

16
0
约5.44千字
约 8页
2017-09-11 发布于湖南
举报
版权申诉

数据挖掘英文论文数据挖掘的论文.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据挖掘英文论文数据挖掘的论文 Web数据挖掘中XML的应用研究摘要：网络的普及基于信息的获取，随着Html技术的发展，数据信息与日俱增.面对浩瀚如烟的信息，要想得到想要的、有用的的信息，必须要对Web信息进行挖掘。而对于Html语言的数据，结构性很差，Web数据挖掘工作很难满足搜索的需要。XML语言的出现极大的改观了这一现状。由于它具有良好的结构性、层次性，所以利用它组织网络页面信息，更有利于进行数据挖掘工作。通过对XML语言的介绍，提出一个基于XML的Web Miner模型，认识XML在Web数据挖掘中的应用。　　关键词：HTML;XML；电子商务；Web数据挖掘　　　　XML Web Application Studies In Data Mining 　　NIU Yan-cheng1, BAO Ying2 　　(1.Lanzhou Jiaotong University, Lanzhou 730030, China; 2.Northwest Normal University, Lanzhou 730070, China) 　　Abstract: The popularization of the Internet is based on the acquisition of information. As the Html technology developing, a number of data information is growing. Facing with the massive information, we must explore the Web information that we wanted and useful. But for the Html language data, its structure is very poor. So the exploration of the Web data is hard to meet the needs of searching. The emergence of the XML language has changed that situation greatly. XML language has good structural property and organizational property, which used for organizing the network information is more conducive to the data mining work. The goal of this paper is to recommend a Miner model based on XML Web by the introduce of the XML language and to know the application of XML Web in the data mining. 　　Key words: HTML; XML; e-commerce; web data mining 　　随着Internet的迅速发展与普及，我们进入了一个数据信息时代。当我们在互联网上搜索自己想要的信息时，面对浩瀚如烟的数据，我们由于缺乏有效的工具与方法，常常会有这样的感觉，如此庞大的信息，却没有我们想要的信息。如此，就有了“入宝山而空手返”的遗憾。于是一项新的挑战，新的技术被提了出来。在这信息爆炸的时代，我们如何才能从中提取有用的信息，提高信息的利用率呢？当今，网络搜索引擎，解决了一部分的问题，但是由于其精确度不高，所以很难让用户满意。Web数据挖掘（Web Data Mining）技术应运而生，已经产生了一些产品，可以对Internet上的信息进行筛选，但是数据库上的数据时结构化的数据，而Web上的数据是无结构化或半结构化的，所以，对Web上信息的挖掘要比对数据库中信息挖掘难的多。这就需要先对页面信息进行重组。　　1 HTML与XML 　　HTML（Hyper Text Mark-up Language ）即超文本标记语言，是WWW的描述语言，由Tim Berners-lee提出，HTML对整个WWW 的发展、知识与信息的流通起了关键的作用, HTML成了Internet上通行最广的标准格式。 HTML是一种面向数据显示样式的标签语言,主要描述文档的标题、字体、颜色等外观方面的属性,由于HTML语言的特点,在进行Web页面信息的开发时,站点的数据都是由开发人员自行设计放置的, HTML只提供如何在浏览器中显示信息的方式, 并没有反映数据本身所包含的语义。HTML数据本身具有自描述性和动态可变