- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
广州航海高等专科学校学报
JOURNAL O F GUAN GZHOU MAR IT IM E COLL EGE
第 13卷第 2期
2 0 0 5 年 1 2 月
Vo l. 13 No. 2
D ec.
2005
文章编号 : 1009 - 8526 ( 2005 ) 02 - 0026 - 04
商务数据识别及处理方法研究
王世杰
(广州航海高等专科学校 软件学院 ,广东 广州 510725 )
摘 要 : 依据数据的几何形态来推断变量间函数关系的原理和 Fuzzy嵌入文法概念 ,提出以数据曲
线特征为依据的商务数据识别及处理方法 . 该模式识别方法中 ,特征重心是在赋予原始数据不同特 征度条件下实现的 ,更接近人为表述数据曲线的心理特征 ,适应于商务数据的预处理 . 同时重点讨
论了处理商务数据过程中的 W eb数据挖掘及有关的可行方法.
关键词 : 商务数据 ;特征 ;信息处理 ;识别
中图分类号 : TP393
文献标识码 : A
商务数据识别 (B u sine ss D a ta, D T)是商务智能
(B u sine ss In te lligence, B I)过程中的一个首要环节 .
商务智能的关键技术就是商务数据的识别和数据管 理 . 实现商务数据的获取 、存储 、处理和共享需要利
用数据识别的技术 [ 1 ] . 商务数据识别技术的关键问
题是如何对信息网络上的庞大数据流进行有效的提 取 ,怎样能够及时获取任意需求的有用数据或相关 信息 ,同时可以定时搜集商务信息数据并能利用实
时系统提供相关的服务 1这里只讨论部分所要解决 的主要问题 .
1 商务数据识别及处理过程
商务数据识别是从数据集中识别出有效的 、新 颖的 、潜在有用的数据 ,由这些数据组合实现最终可 理解的模式的高级处理过程 . 其数据集是数据库记 录的集合 F ,模式是使用语言 L 表示的 F 中部分记 录的表达式 E, 它所描述的数据集是集合 F 的一个
子集 F . 可知发现的数据是新的 , 表达式 E 也称为
E
模式 ,也应该是新的 ,有使用价值 ,并能被用户所理
解 [ 2 ] . 商务数据识别及处理过程如图 1所示 .
图 1 商务数据识别及处理过程
从图中可知 ,数据转换是将各类数据按照约定
进行符号转换和归纳 ,如把连续值数据转换为离散 型数据 、数据格式规范 、或是把离散型数据转换为连 续型数据等 ;商务数据识别的目的是确定发现任务 的操作对象 ,即商务目标数据 ,是根据用户的需要从
混合数据集中识别抽取的有效商务数据. 商务数据
处理一般包括消除噪声 、推导计算缺值数据 、消除重 复记录 、减少冗余及数据挖掘等 ,商务数据处理的主 要目的 是 减 小 数 据 维 数 或 降 维 ( D im en sion R educ2 tion) ,即从原特征中找出真正有用的特征以减少数
收稿日期 : 2005 - 12 - 09
基金项目 : 广东省教育厅自然科学基金项目 ( 0131 )
作者简介 : 王世杰 ( 1951 - ) ,男 ,教授 ,主要从事信息处理与电子商务研究 1
据挖掘时要考虑的特征或变量个数 . 其中数据挖掘
阶段首先要确定挖掘的任务或目的 ,如数据分类 、聚 类 、关联规则或序列模式发现等 . 在此基础上 ,决定 使用什么样的处理方法或算法.
称 di 为数据 ( xi , yi )的曲线特征度 , di ∈[ 0, 1 ].
可记 :
xi ( 1 )
yi ( 1 )
= ( di - 1 xi - 1
= ( di - 1 yi - 1
+ di xi + di + 1 xi + 1 ) /m i ,
+ di yi + di + 1 yi + 1 ) /m i 1
( 4 )
式中 m i = di - 1 + di + di + 1 , i = 2, 3,
, n - 1.
2 商务数据识别
而
x1 ( 1 ) = ( d1 x1 ( 0 ) + d2 x2 ( 0 ) ) / ( d1 + d2 ) ,
y1 ( 1 ) = ( d1 y1 ( 0 ) + d2 y2 ( 0 ) ) / ( d1 + d2 ) .
从技术的角度上看 ,商务数据识别就是从多种
数据信息 (包括文档 、图形图像 、声音 ) 、有噪声的 、 属性模糊 、随机储存的有量数据中 ,主要利用人工智 能 、模型匹配 、文法识别 、W eb 技术以及多种网络信
息检 索 技 术 , 在 B to AM to B ( B u sine ss to A gency
M ach ine to B u sine ss
您可能关注的文档
最近下载
- 齿轮箱与联轴节试验台.pdf VIP
- 新解读《FZ_T 07027 - 2023绿色设计产品评价技术规范 儿童服装》最新解读.docx VIP
- PTC-中车长客PDM方案建议书20170609_Final.pptx VIP
- sfet7750700c动车组检修kwd联轴节扩压检查作业指导书.pdf VIP
- SFET-77-50500-C-动车组检修KWD联轴节退卸作业指导书-——【上海动车段三级修】.pdf VIP
- JJF(黑)13-2021加油机付油商品量检验规则.docx VIP
- 产品数据管理年终总结.pptx VIP
- 产品数据管理系统项目.pdf VIP
- CRH2A统型动车组三级修联轴节(KWD)组装作业指导书.pdf VIP
- 新时代好少年如何培养.pptx VIP
原创力文档


文档评论(0)