- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络知识挖掘在数字参考咨询中的实现_通信学论文
网络知识挖掘在数字参考咨询中的实现_通信学论文
【内容提要】文章着重阐述了网络知识挖掘产生的背景及其概念、技术,探讨了网络知识挖掘在数字参考咨询服务中的应用。
【摘 要 题】信息需求与服务
【关 键 词】数字参考咨询/数据挖掘/网络知识挖掘
【正 文】
1 网络知识挖掘产生的背景及其概念、技术
对知识挖掘的设想始于20世纪80年代末。当时出现了从源数据中发掘新信息模式及算法,被称为数据中的知识发现(Knowledge Discovery in Database,KDD)。这种想法的出现是由于此前的信息或知识数据库存在着种种局限,限制了对数据库中蕴涵知识的有效利用[1]。知识发现被认为是今后具有重要影响和应用前景的关键技术。知识发现(knowledge discovery)也称数据挖掘(data mining),源自人工智能的机器学习领域,是在一个已知状态的数据集上,通过设定一定的学习算法,从数据中获取所需的知识[2]。数据挖掘广泛应用于数据仓库和分布式数据库中,根据数据间的相互关系进行数据分析,提取潜在有用的信息和知识,经挖掘后被发现的知识可用于信息管理、查询优化、科学研究、决策支持、过程控制等。现有的数据挖掘工具有:Model Quest Miner、Knowledge Seeker、Business Miner、Anser Tree等几十种。数据挖掘是网络知识挖掘的基础。网络知识挖掘是指利用数据挖掘技术,自动地从由异构数据组成的网络文档中发现和抽取知识,从概念及相关因素的延伸比较上找出用户需要的深层次知识的过程[3]。网络知识挖掘可分为网络内容挖掘(Web Content Mining)、网络结构挖掘(Web Construct Mining)、网络使用挖掘(Web Usage Mining)。一般而言,网络知识挖掘的发现技术主要包括以下几个方面。
1.1 路径分析
可以用许多曲线图解法来进行路径分析,一个曲线代表了Web页面间或者其他事物之间的一些联系。
1.2 关联规则
关联规则用于发现数据项之间的联系,在网络挖掘中就是发现某一顾客的引用页面和服务器上多种页面之间的联系。
1.3 序列模式
应用序列模式是为了发现一些交互模式,如在一时间段内某一数据项后面跟着另一个数据项。在服务器日志文件中,记录了一段时间内客户的访问信息,对Web服务器中访问日志的序列模型分析可以使用企业预测用户访问模式,帮助广告进行目标定位,发现在一个时间段内访问某一文件的所有客户的相同特征等。
1.4 聚类和分类
根据一些数据项的共同特征来对数据库进行分类。在网络挖掘中,分类技术可以基于用户的一些人口统计信息和访问模式对访问某文档的用户进行偏好描述。聚类分析可以将有相似特征的用户或者数据聚集在一起,聚类Web日志的用户信息和数据可用来制定未来市场营销策略[4]。
2 网络知识挖掘与数字参考咨询知识库的建立
数字参考咨询的概念起源于20世纪80年代的美国,早期的电子邮件咨询服务起源于1984年的华盛顿大学健康科学图书馆和马里兰—巴尔迪摩大学健康图书馆[5]。在美国,图书馆界对数字图书馆的发展存在两种看法,其中一种把图书馆看作是一个在图书馆员的协助下为广大用户提供智能服务的透明的知识网络。数字参考台就是根据这种意见建立起来的对话式的智能服务系统[6]。数字参考咨询是伴随着数字图书馆的研究和实践热潮出现的又一大热点,也是网络环境下图书馆参考咨询服务的主流发展方向。利用网络知识挖掘技术,可以了解用户访问图书馆的目的和趋势,了解用户的兴趣和需求,改进服务质量,变被动服务为主动服务,提高数字参考咨询服务的效率。
数字化信息资源是数字参考咨询的物质基础,它由各类知识库构成。数字参考咨询是从积累知识库到进行知识服务,可以在面对面与用户沟通中判断用户的实际需求,由此来加深知识服务层面的深度和广度。知识库的建设直接影响到数字参考咨询服务。可想而知,如果没有知识库或知识库内容非常少,仅凭咨询员个人的知识经验很难满足不同用户的各类需求。网络在提供丰富资源的同时,也给查找和获取有效信息带来了难度。传统的数据挖掘涉及的主要是结构化及半结构化的数据库,而网上的信息变化频繁且具动态性,是一个巨大而又复杂的异构型数据库,对网上的信息进行挖掘要比面向单个数据库复杂得多。数字资源的多元性和分散性,使数字化信息的知识化挖掘和链接成为信息服务所面临的前沿挑战。因此,对数据的进一步加工和内容分析显得越来越重要。在这样的背景下,网络知识挖掘的新技术应运而生。
网络知识挖掘的类型可分为对网络知识的挖掘和对用户知识的挖掘。对网络知识的挖掘主要是指通过对网络信息的定性定量的增值处理,找出
您可能关注的文档
- 组合式冷库工程设计及报价系统开发与研究_电子机械论文.doc
- 组合支护形式在地铁车站围护中的应用_工程建筑论文.doc
- 细胞移植修复脊髓损伤的进展_计算机论文.doc
- 经评审的最低投标价法的探讨_工程建筑论文.doc
- 结合SCE法的粒子群优化QoS路由算法_计算机论文.doc
- 结合南京地铁建设谈盾构隧道施工_工程建筑论文.doc
- 结构专业施工图审查中常见的若干问题_工程建筑论文.doc
- 结构工程师对计算机的滥用_工程建筑论文.doc
- 结构延性与抗震设计 _工程建筑论文.doc
- 结构的检测与加固技术_工程建筑论文.doc
- 2024年沧州市公务员考试行测真题及答案详解(名师系列).docx
- 粮油食品检验人员复习提分资料带答案详解(精练).docx
- 粮油食品检验人员自我提分评估(考点精练)附答案详解.docx
- 粮油食品检验人员全真模拟模拟题附参考答案详解(精练).docx
- 2025年延安市公务员考试行测试卷历年真题附答案详解(突破训练).docx
- 2025年株洲市公务员考试行测试卷历年真题含答案详解.docx
- 2024年枣庄市公务员考试行测真题及完整答案详解1套.docx
- 2024年抚顺市公务员考试行测真题及答案详解(各地真题).docx
- 2025年常州市公务员考试行测真题及一套参考答案详解.docx
- 2023年德州市公务员考试行测试卷历年真题及1套完整答案详解.docx
最近下载
- 3.1 贯彻新发展理念课件(共29张PPT)-(2024年)高一政治上学期(统编版必修2).pptx VIP
- 国家开放大学电大本科《人文英语4》2025-2026期末试题及答案(试卷号:2025).pdf VIP
- 2023年齐鲁师范学院计算机应用技术专业《计算机组成原理》科目期末试卷A(有答案).docx VIP
- 2025年支部查摆问题清单及整改措施落实表 .pdf VIP
- 历年(2020-2024)全国高考数学真题分类(导数及其应用小题)汇编(附答案).pdf VIP
- 贵州省市容环境卫生统一劳动定额.pdf VIP
- 3.1贯彻新发展理念 课件(共33张ppt)35.pptx VIP
- 2023年齐鲁师范学院计算机应用技术专业《计算机组成原理》科目期末试卷B(有答案).docx VIP
- 高思奥数一年级下册含答案第17讲测量.pdf VIP
- 2025北京市朝阳区招聘社区工作者425人笔试备考试题及答案解析.docx VIP
文档评论(0)