- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘的工业标准的现状和展望 - 计算机应用研究
·8 · 计算机应用研究 2004 年
数 据 挖 掘 的工 业 标 准 的现 状 和 展 望
方 骏, 方 云, 肖 杰
( 浙江 大学 信 息学 院, 浙 江 杭州 3 10027)
摘 要: 简单介 绍了数据 挖掘 的基 本 内容和作 用, 回顾 了数 据挖掘在 国 内的应 用和 发展 情 况, 提 出 了数 据 挖掘
的行 业标 准问题及标 准制 定的重要 性。鉴于 国内的数据 挖掘 行业 尚未有相 关的行业标准, 简单介 绍 了几个 目前
国外 比较 流行 的标准 ( PMML, OLE DB DM, CRISP- DM 等) 及行 业标 准制 定中有待 完善和发展的方 面。
关键 词: 数 据挖掘; 行业标准; PMML; OLE DB DM; CRISP- DM; SEMMA
中图法分 类号 : TP311. 12 文献标 识码 : A 文章编 号: 1001- 3695( 2004) 06- 0008- 03
The Current and Prospective Industry Standards for Data Mining
FANG Jun, FANG Yun, XIAO Jie
( School of Information Science Engineering, Zhejiang University, Hangzhou Zhej iang 310027 , China)
Abstract: The paper introduces the basic concepts of data mining and evaluates the current application and development of
data mining in China. Because of the lack of systematic industry standards for data mining in China, this paper briefly intro-
duces the current tentative industry standards, most of which have been successfully applied in western countries, for the refer-
ences of scientists and developers in China. Meanwhile, the prospective industry standards are also discussed.
Key words: Data Mining; Industry Standards; PMML; OLE DB DM; CRISP- DM; SEMMA
随着社会和技术的进步, 各个行业 的数据正 以几何级数的
1 我国的数据挖掘的行业现状
速度在增长, 例如在运营 B2C 的网站上, 保存着大量( 几十 GB
到几 TB) 的关于访 问客户的点击行为和所购 买商品的数据记 目前, 我国的数据挖掘 行业 尚处于初 始发展 阶段, 但是推
录。数十年来, 随着计算机技术 的进步, 大批 数据库 已经建立
广的速度是十分迅速 的。特别 是关于数据挖掘算法 的研究工
起来 了, 但是对于这些快速增长 的海量 数据而 言, 由于缺乏强
作, 近两年有大量的关于算法的报 道和论文发表, 如 具有非对
有力的工具, 理解它们 已经远远超 出了人的能力, 从而使得 收
文档评论(0)