- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
WEB文本挖掘在客户知识管理中应用
WEB文本挖掘在客户知识管理中的应用
提要本文以客户知识管理需求为出发点,对WEB页面中富有知识资源价值的WEB文本及其挖掘方法进行研究,提出客户知识管理中的WEB文本挖掘采集方法,为进一步实现分布式知识资源的动态配置与管理打下了良好的基础,从而更好地支持客户知识管理实施。
关键词:知识管理;客户知识采集;WEB文本挖掘
中图分类号:C93文献标识码:A
一、引言
随着知识经济的发展,企业基于信息的竞争优势正在向基于知识创造的竞争优势发展,知识作为一种稀缺资源成为经济发展的核心要素。企业的知识资产不仅可以增加企业的市场竞争力,不断充实企业知识资本,累积企业实力,还能更好的支持企业管理。因此,知识管理作为企业管理的新模式悄然兴起,实施知识管理成为企业的重要战略。
在客户关系管理中,传统的方法是采用客户服务模式处理客户的信息和知识,其核心是建立基于售后服务的客户知识采集、反馈体系。本文以客户知识采集需求为基础,以WEB文本中的客户知识为采集目标,以WEB文本挖
掘的相关方法与技术为手段,创建了基于WEB文本挖掘客户知识采集方法,具有很广的研究和应用价值。
二、基于WEB文本挖掘的客户知识管理方法
(一)知识管理的概念。世界知识管理之父Sveiby博士1986年在世界上首次提出知识管理这个名词。知识管理的概念可从狭义和广义的角度理解:狭义的知识管理主要是针对知识本身的管理,包括对知识的创造、获取、加工、存储、传播和应用的管理;广义的知识管理不仅包括对知识进行管理,而且包括与知识有关的资源和无形资产的管理,涉及知识组织、知识设施、知识资产、知识活动、知识人员的全方位和全过程的管理。
(二)客户知识管理理论。1997年美国学者韦兰与科尔首次完整提出了客户知识管理(简称CKM)。CKM是一种管理策略,它使得企业组织、工作流程、技术支持和客户服务以客户为中心来协调和统一与客户的交互行动,从而达到获取、发展、保留价值客户,挖掘潜在客户,提升客户满意度和忠诚度,最终使客户长期价值最大化,为企业增加盈利。作为解决方案,CKM集合了当今最新的信息技术,包括Internet和电子商务、多媒体技术、数据仓库和数据挖掘、专家系统和人工智能、呼叫中心以及相应的硬件环境。
(三)基于WEB挖掘的知识采集。知识采集作为一个外来词,又名知识获取、知识抽取。本文采用知识采集,主要是为了进一步突出在这个过程中对知识的收集和分类。知识采集也有自己的生命周期。从早期的直接从原始资料(人类专家和书面材料)中采集知识,到中期的从知识素材中提炼规律性知识,再到后期的通过实践检验和修正知识,经历过无数次周而复始的循环。客户知识采集过程体系应包括三项基本功能:(1)数据或信息采集功能;(2)信息到知识的转化功能;(3)知识分类功能。
企业关注客户服务,采集经销商和最终消费者对产品提出的各类问题及意见,这些信息和知识很大一部分存在于分布在全国各地经销商的网站中,知识采集者不可能一一登录网站查看。因此,需要设计面向WEB页面的知识采集方法,实现自动获取。
(四)WEB文本挖掘方法。在WEB文本挖掘中,文本的特征表示挖掘工作的基础,而文本分类和聚类是两种最重要、最基本的挖掘方法。
矢量空间模型(VSM)是近年来应用较多且效果较好的方法之一。在该模型中,文档空间被看作是由一组正交词条矢量所形成的矢量空间,每个文档d表示其中的一个范化特征矢量:
V(d)=(t1,w1(d);…;ti,wi(d);…;tn,w(d))
其中ti为词条项,wi(d)为ti在d中的权值。可以将d中出现的所有单词作为ti,也可以要求ti是d中出现的所有短语,从而提高内容特征表示的准确性。
wi(d)一般被定义为ti在d中出现频率tfi (d)的函数,即:
wi(d )=(tfi(d))(1)
式中常用的有:
布尔函数――=1,tf(d)?1
0,tf(d)=0
平方根函数――=
对象函数――=log(tfi(d)+1)
TFIDF函数――=tfi(d)×log[N/ni]
其中,N为所有文档的数目,ni为含有词条ti的文档数目。
文本分类是一种典型的有教师机器学习问题,一般分为训练和分类两个阶段,具体过程如下。
1、训练阶段:①定义类别集合C={c1,…,ci,…,cn},这些类别可以是层次式的或并列式的;②给出文档集合S={s1,…,sj,…,sn},每个训练文档sj,标上类别标识cj;③统计S中所有文档的特征矢量V(sj),确定代表C中每个类别的特征矢量V(cj)。
2、分类阶段:①对于测试文档集合T={d1,
您可能关注的文档
- RFID技术在物流行业运用.doc
- RFID技术在物联网支付中应用.doc
- RIA在网络营销中应用.doc
- ROI理论在广告创作中应用.doc
- Rough集理论在高科技投资项目评估中应用.doc
- RSVIEW SE在火电厂辅助控制系统PLC联网中应用.doc
- RSGIS在土地整理工作中应用.doc
- RTG油改电技术实施与实效分析.doc
- RTK在数字测图中提高效率应用.doc
- RTK技术与全站仪联合测图在土地整理项目中作用.doc
- 2021-2022学年陕西省三原县北城中学高一月考数学试卷.docx
- 2021-2022学年吉林省辉南县第六中学高一上学期周测数学试卷.docx
- 安徽省亳州市第五完全中学2021-2022学年高一上学期期中考试历史试题.doc
- 2021-2022学年黑龙江绥化市第一中学高一上学期期中考试数学试卷.doc
- 2021-2022学年河南省商丘一中高一上学期期中语文试题.docx
- 2020-2021学年河北省衡水市第二中学高一上学期期中语文试题(解析版).doc
- 2020-2021学年河北省衡水市第二中学高一上学期期中语文试题.doc
- 2020-2021学年四川省资阳市高一上学期期末语文试题.docx
- 2021-2022学年福建省泉州市永春县一中高一上学期期中语文试题(解析版).doc
- 2020-2021学年四川省资阳市高一下学期期末语文试题.docx
最近下载
- 消防整改维修工程施工方案范文模板.docx
- 《金版教程(物理)》2025高考科学复习解决方案第十四章 光第1讲 光的折射、全反射含答案.doc
- 浪潮信息(000977)公司2023年财务分析研究报告.doc
- 自建房买卖合同样本自建房买卖合同格式.docx
- 川教版(2024)七年级上册信息科技 7.5在线协作选素材 课件.pptx VIP
- 2024年1月国家开放大学本科《当代中国政治制度》期末纸质考试试题及答案 .pdf VIP
- 新一代大学英语发展篇视听说教程1答案.docx
- 上海中考数学复习要点汇总.docx VIP
- 第14课丝绸之路的开通与经营西域(课件)-七年级历史上册同步教学课件(统编版2024).pptx VIP
- 门诊采血室优质护理服务.pptx VIP
文档评论(0)