- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络信息挖掘系统评价初探_计算机网络论文
网络信息挖掘系统评价初探_计算机网络论文
【正文】
随着电子商务的蓬勃兴起,许多企业已经开始意识到其所拥有的丰富的信息资源在商业决策中具有潜在的巨大商业价值。更好的决策支持需求和企业电子商务的开展正推动着网络信息挖掘系统的研究与开发。
鉴于网络信息挖掘是在数据挖掘的基础上发展起来的,因此对于网络信息挖掘系统的基本问题,本文仍将利用数据挖掘系统的基本理论来描述。
目前,由于网络信息挖掘系统的发展正在起步阶段,因此它的分类还无法达到数据挖掘系统分类那样细致。具体而言,对网络信息挖掘系统分类可以从商业能力、挖掘数据类型、挖掘功能、数据分析方法和应用领域角度进行。其中商业能力角度的分类与数据挖掘系统的商业能力分类完全相同,即分为商业产品和研究原型。而从另外几个角度看,网络信息挖掘系统的类型具有自身一些特点,例如从应用领域角度看,网络信息挖掘系统可以分为面向电子商务型、面向远程教育型、面向旅游型、面向广告业型等。随着网络信息挖掘技术的进一步发展,将出现更加丰富的网络信息挖掘系统类型。
1 系统评价现状调查
据调查,目前国内外还没有出现完全针对网络信息挖掘系统的评价成果,因而对网络信息挖掘系统的评价具有一定的创新性。笔者认为,对网络信息挖掘系统的评价可以充分地借鉴数据挖掘系统的评价方法。应该说这两类系统在很多评价指标上都有重合。
从国外来讲,1998年前后已经有一些研究人员和机构对数据挖掘系统进行了一定的评价研究。他们所采用的评价体系各有特点,以下是一些简要介绍。
1)J.F.Elder等人主要对17种数据挖掘系统进行了评价[1],其中包括了著名的Clementine、IntelligentMiner系统。这些系统具有以下共同的特点:单平台(StandAlone)、多用途、支持多种模式和分类算法,并支持模式构建中的项目阶段。他们主要从6大方面对这些系统进行比较,除此之外,他们还单独从用户端角度对数据挖掘系统性能进行评价。他们认为并非支持的算法越多越好,各种算法面对不同的问题其解决能力也是不同的,它们具有自身的优点与缺点。在文章的最后,还对这17种产品的优势/劣势作了总体的描述性评价。
2)M.A.King等人针对14种桌面型数据挖掘系统[2],重点对各个系统的特征和性能进行比较。他们选用了20个评价指标,并设计了一个标准的评价过程——6分制评分标准来评价各种软件工具的优点和缺点。他们评价的特色在于针对4种算法的产品分别评价,并采用4类数据集测试系统的性能。他们认为网络法(PolynomialandNeural)要比分割法(TreesandRules)更精确,另外也提出可以加入计算机环境、数据库连接性、提供商的稳定性等指标进一步评价。
3)D.W.Abbott等人主要针对高端型(High-end)用于欺诈甄别的数据挖掘系统进行了评价[3]。尽管仅选择了5个系统(Clementine、IntelligentMinerforMata、Darwin、En-terpriseMiner、PatternRecognitionWorkbench)进行评价,但是他们针对这5个专门应用于欺诈甄别的系统进行了细致的比较。
4)M.Goebel等人将数据库中知识发现(KDD)与数据挖掘结合到一起评价[4]。他们在介绍一般知识发现任务以及解决这些任务的方法基础上,主要调查了43种提供这类功能的软件工具。这些工具既包括研究的原型系统,也包括已经商业化的产品。其中有较为著名的Clementine、DBMiner、IntelligentMiner系统。他们采用了一个系统特征分类体系对上述产品进行比较,并提出一些尚待解决的问题:如不同技术的集成、可扩展性、与数据库的无缝集成、对正在变化中的数据进行管理以及非标准的数据类型等问题。
5)J.Hah博士没有针对个别的数据挖掘系统具体评价,但他认为评价一个数据挖掘系统应包括如下几个方面[5]:数据类型、系统问题、数据源、数据控制的功能与方法、数据挖掘系统和数据库或数据仓库系统的结合、可伸缩性、可视化工具、数据挖掘查询语言和图形用户接口。
6)A.Berson等认为数据挖掘软件产品因为不同的目标用户和不同类型的解决问题而具有不同的重点[6]。主要可以分为目标解决方案、商业工具、商业分析工具、研究分析工具4类。另外,从目前整个数据挖掘市场看也可以分成3个主要组成部分:通用的工具、综合DSS/OLAP/数据挖掘工具和快速成长的面向特定应用的工具。他们还进一步提供了一套专门用于数据挖掘工具评价的属性和方法,对11种具体的工具进行了评价,其中包括Clementine、IntelligentMiner等著名的工具。
您可能关注的文档
- 立式陈列柜风幕数值模拟的双流体模型_工程建筑论文.doc
- 竹子在章丘市园林绿化中的应用_工程建筑论文.doc
- 第三代移动通信系统的研究现状和发展趋势_通信学论文.doc
- 第四代移动通信系统概述_计算机论文.doc
- 等截面水泥烟道沿程阻力研究_工程建筑论文.doc
- 筑路机械冷却装置液压驱动系统的总体设计_工程建筑论文.doc
- 筑路机械机群智能化的多智能主体系统研究_电子机械论文.doc
- 筒仓侧压力研究历程回顾与展望_工程建筑论文.doc
- 筒体滑模顶升屋面网架在工程中的应用_工程建筑论文.doc
- 简析校园网中IP地址的动态分配_计算机网络论文.doc
- 2025年网络文学平台版权运营模式创新与版权保护体系构建.docx
- 数字藏品市场运营策略洞察:2025年市场风险与应对策略分析.docx
- 全球新能源汽车产业政策法规与市场前景白皮书.docx
- 工业互联网平台安全标准制定:安全防护与合规性监管策略.docx
- 剧本杀剧本创作审核标准2025年优化与行业自律.docx
- 2025年新能源电动巡逻车在城市安防中的应用对城市环境的影响分析.docx
- 全渠道零售案例精选:2025年行业创新实践报告.docx
- 2025年网约车司乘纠纷处理机制优化与行业可持续发展报告.docx
- 2025年宠物烘焙食品市场法规政策解读:合规经营与风险规避.docx
- 2025年宠物行业数据安全监管政策影响分析报告.docx
最近下载
- 《常考题》初中八年级数学上册第十三章《轴对称》习题(含答案解析).docx VIP
- 《事件相关电位入门》课件.ppt VIP
- 《儿童骨科疾病诊断》课件.ppt VIP
- 公司战略与风险管理 第3版 吕文栋 教学大纲+教案1--3.doc
- 12SG121-1 施工图结构设计总说明(混凝土结构) .docx VIP
- 一种实验室危化品试剂进出库智能化管控系统及管控方法.pdf VIP
- 专练08:读后续写-2020-2021学年高一英语下学期期末题型专项训练.docx VIP
- 动脉血标本采集技术操作考核及评分标准.docx
- AI驱动的知识图谱:混合式教学模式创新研究.docx VIP
- AI辅助混合式教学设计实践与效果评估.docx VIP
文档评论(0)