网络信息分类法 (2).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

对文本进行分词,抽取表达网站主题内容的语词;分析语词的重要程度、词频统计,给出权值,以确定哪些可作为网站主题内容的特征项。将抽取的特征项与分类知识库所形成的矢量空间模型进行相似性匹配,以能涵盖各特征项的类目为主要类目,其他为次要类目。第29页,共52页,星期日,2025年,2月5日编制网站的提要及其他说明标识。经过标引、著录的网站存入索引数据库。把网站加进分类导航系统,并自动进行排序。第30页,共52页,星期日,2025年,2月5日第二节网络信息分类法的编制网络信息分类导航系统中查询界面、类目体系、各级类目及其链接的网络信息是它的分类法部分。知识分类体系的构建。综合性搜索引擎与专业性搜索引擎或网站不同。第31页,共52页,星期日,2025年,2月5日聚类的标准。主要标准“主题和专题”,学科和专业作为辅助标准;专业分类法可以学科或专业为主要聚类标准,或二者结合。大类的设置。数量15~20个;大类设置要有较高的稳定性,通常一、二级类目构成网络信息分类法组织的核心框架。第32页,共52页,星期日,2025年,2月5日分类体系展开的层次。它决定着分类导航系统、知识地图的详略程度;3~6级之间。类目的种类:包括子类和网站两种。网站是分类系统展开的最末级,点击后进入不属于分类系统的网页。第33页,共52页,星期日,2025年,2月5日G网页目录

kidsandteenspre-schoolCategories:ABC’sand123’s(56)games(33)shapesandcolors(32)…Webpages:noggin-/kidsComJr-/…第34页,共52页,星期日,2025年,2月5日类目名称。准确、通用和精练。多分类体系的运用。“主-从分类体系”。例如,主分类体系娱乐休闲、求职与招聘、艺术、生活服务、文学、计算机与互联网、教育就业、体育健身、医疗健康、社会文化、科学技术、社会科学、政治军事、新闻媒体、参考资料、个人主页、商业经济、少儿搜索第35页,共52页,星期日,2025年,2月5日S的从分类体系新闻、财经、娱乐、房产、女性游戏、旅游、校园、动漫、同学录、企业、短信体育、科技、音乐、汽车、……第36页,共52页,星期日,2025年,2月5日类目的划分与设置分类标准及使用次序。主题分类法,以事物为主要聚类标准;“多重列类”为网络分类法类目划分的重要方法。类目的均衡性。同一级的各个类目包含的信息不应相差太悬殊,否则增加不必要的浏览路径,影响分类导航的效果。第37页,共52页,星期日,2025年,2月5日第1页,共52页,星期日,2025年,2月5日第一节概述网络信息的特点:数量巨大而繁杂;内容范围广泛;信息类型众多;动态性高;超文本链接;有序与无序。网络信息用户的特点:用户范围极广;受教育程度差别极大;利用网络信息的目的和类型存在明显差异;用户使用的网络服务不同。第2页,共52页,星期日,2025年,2月5日网络信息技术环境的特点:TCP/IP、数字技术、多媒体技术、超文本、WWW、人工智能、数据库技术及相应的硬件等。网络信息的组织和网络信息分类法的编制,只有与当时网络信息环境技术相适应,才能最大限度地发挥信息组织的作用。第3页,共52页,星期日,2025年,2月5日网络信息分类法与传统分类法比较分类对象:传统分类法以物理的、实体的文献,如印刷型文献、磁带、光盘等为主要处理对象,对文献的内容进行标引和整序。网络信息分类法以数百万计服务器上的信息资源为处理对象,对它们进行组织筛选,信息数字式、多媒体、动态、虚拟的。第4页,共52页,星期日,2025年,2月5日信息的知识范围:传统分类法以文献收藏部门为使用对象,文献的出版是受控制的、内容是经过一定筛选的,分类体系具有稳定性。网络信息分类法以搜索引擎或大型网站为使用对象,网络信息总体上是不受控制的,几乎包含了人类一切知识领域,要求其具有高度的灵活性和适应网络信息的动态性。第5页,共52页,星期日,2025年,2月5日分类法的功能:传统分类法通过对全部文献标引,编制分类检索工具,组织分类排架,分类标引基本是手工的。网络分类法通过对网络信息的标引,建立网络信息分类导航系统,提供浏览式检索手段,分类导航系统的建立和维护主要是手工式的,也有人机结合。第6页,共52页,星期日,2025年,2月5日分类标记:是传统分类法不可缺少的组成部分。网络分类法组织虚拟信息,一个类目就是一类相关信息的节点,不涉及物理排列,用户不需要根据分类标记索取信息,也无须使用分类标记,但作为网络分类法的后台运作,分类标记有用。第

文档评论(0)

xiaozhuo2022 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档