商务数据识别及处理方法研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
广州航海高等专科学校学报 JOURNAL O F GUAN GZHOU MAR IT IM E COLL EGE 第 13卷第 2期 2 0 0 5 年 1 2 月 Vo l. 13 No. 2 D ec. 2005 文章编号 : 1009 - 8526 ( 2005 ) 02 - 0026 - 04 商务数据识别及处理方法研究 王世杰 (广州航海高等专科学校 软件学院 ,广东 广州 510725 ) 摘 要 : 依据数据的几何形态来推断变量间函数关系的原理和 Fuzzy嵌入文法概念 ,提出以数据曲 线特征为依据的商务数据识别及处理方法 . 该模式识别方法中 ,特征重心是在赋予原始数据不同特 征度条件下实现的 ,更接近人为表述数据曲线的心理特征 ,适应于商务数据的预处理 . 同时重点讨 论了处理商务数据过程中的 W eb数据挖掘及有关的可行方法. 关键词 : 商务数据 ;特征 ;信息处理 ;识别 中图分类号 : TP393 文献标识码 : A 商务数据识别 (B u sine ss D a ta, D T)是商务智能 (B u sine ss In te lligence, B I)过程中的一个首要环节 . 商务智能的关键技术就是商务数据的识别和数据管 理 . 实现商务数据的获取 、存储 、处理和共享需要利 用数据识别的技术 [ 1 ] . 商务数据识别技术的关键问 题是如何对信息网络上的庞大数据流进行有效的提 取 ,怎样能够及时获取任意需求的有用数据或相关 信息 ,同时可以定时搜集商务信息数据并能利用实 时系统提供相关的服务 1这里只讨论部分所要解决 的主要问题 . 1 商务数据识别及处理过程 商务数据识别是从数据集中识别出有效的 、新 颖的 、潜在有用的数据 ,由这些数据组合实现最终可 理解的模式的高级处理过程 . 其数据集是数据库记 录的集合 F ,模式是使用语言 L 表示的 F 中部分记 录的表达式 E, 它所描述的数据集是集合 F 的一个 子集 F . 可知发现的数据是新的 , 表达式 E 也称为 E 模式 ,也应该是新的 ,有使用价值 ,并能被用户所理 解 [ 2 ] . 商务数据识别及处理过程如图 1所示 . 图 1 商务数据识别及处理过程 从图中可知 ,数据转换是将各类数据按照约定 进行符号转换和归纳 ,如把连续值数据转换为离散 型数据 、数据格式规范 、或是把离散型数据转换为连 续型数据等 ;商务数据识别的目的是确定发现任务 的操作对象 ,即商务目标数据 ,是根据用户的需要从 混合数据集中识别抽取的有效商务数据. 商务数据 处理一般包括消除噪声 、推导计算缺值数据 、消除重 复记录 、减少冗余及数据挖掘等 ,商务数据处理的主 要目的 是 减 小 数 据 维 数 或 降 维 ( D im en sion R educ2 tion) ,即从原特征中找出真正有用的特征以减少数 收稿日期 : 2005 - 12 - 09 基金项目 : 广东省教育厅自然科学基金项目 ( 0131 ) 作者简介 : 王世杰 ( 1951 - ) ,男 ,教授 ,主要从事信息处理与电子商务研究 1 据挖掘时要考虑的特征或变量个数 . 其中数据挖掘 阶段首先要确定挖掘的任务或目的 ,如数据分类 、聚 类 、关联规则或序列模式发现等 . 在此基础上 ,决定 使用什么样的处理方法或算法. 称 di 为数据 ( xi , yi )的曲线特征度 , di ∈[ 0, 1 ]. 可记 : xi ( 1 ) yi ( 1 ) = ( di - 1 xi - 1 = ( di - 1 yi - 1 + di xi + di + 1 xi + 1 ) /m i , + di yi + di + 1 yi + 1 ) /m i 1 ( 4 ) 式中 m i = di - 1 + di + di + 1 , i = 2, 3, , n - 1. 2 商务数据识别 而 x1 ( 1 ) = ( d1 x1 ( 0 ) + d2 x2 ( 0 ) ) / ( d1 + d2 ) , y1 ( 1 ) = ( d1 y1 ( 0 ) + d2 y2 ( 0 ) ) / ( d1 + d2 ) . 从技术的角度上看 ,商务数据识别就是从多种 数据信息 (包括文档 、图形图像 、声音 ) 、有噪声的 、 属性模糊 、随机储存的有量数据中 ,主要利用人工智 能 、模型匹配 、文法识别 、W eb 技术以及多种网络信 息检 索 技 术 , 在 B to AM to B ( B u sine ss to A gency M ach ine to B u sine ss

文档评论(0)

tcpe + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档