- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分类目录用户研究综述
1 ?分类目录研究现状
1.1分类目录的功能和优势
网络分类冃录是丿应用分类的方法对巨大的网络资源进行组织和揭示的有效 手段。它可以提供浏览方式的信息查询途径,具有直观、易检的优点。分类冃录 的使用,可以使得用户更易查找到所需信息。
分类检索是以分类H录浏览方式提供信息查询途径,一般称为网络分类冃 录。由专家选取一些网页,以某种分类方法进行组织,建立主题树分层冃录,并 将采集、筛选后的信息分门别类地放人各大类或子类下而,用户通过层层点击, 随着范囤的缩小与查询专指度的提高,最终满足用户的查询需求。网络分类冃录 在检索方面有以下优势:
分类浏览方式直观。在检索冃的不明确、检索词不确定时,分类浏览方式更有 效率,适合网络新手。
2?检准率高。网络分类冃录由人工抓取、标引,网页学术性强,检索效呆好。另 一方而用户参与程度高,在分类冃录的指导下,逐步明确用户的检索需求,检 索冃的性更强更明确,检索效率提高。尽管网络分类冃录较检索法具有一定的优 势,但是,要提高检全率、检准率,采用科学的分类方法是至关重要的。分类标 准是提供优质检索服务的重耍保障。
1.2中文搜索引擎分类目录状况
冃前中文搜索引擎有70多种。其中,只有“网络指南针”是采用《屮图法》 建立网络冃录的。冃前也只有两级类冃的框架、内容不够丰富,其他的中文搜索 引擎都是自编的网络分类冃录。由丁缺乏统一的网络信息分类标准,各搜索引擎 的分类体系无法兼容,用户检索需耍适应各个搜索引擎不同的网络分类方法。例 如,搜狐的分类冃录包括18个大类.
从这些搜索引擎网站分类冃录状况可以得出以下结论:
1.网上搜索引擎应用的分类方法较文献分类法检索有其优越性。
2?在分类体系上,采用以主题、事物为主的聚类方法,替代了以学科为中心的聚 类方法。即围绕某一主题、某一事物集中关于这一主题、这一事物的相关信息。 例如,在“雅虎”分类冃录屮查找“因特网”方而的信息,进人“电脑与因特网” 下的“因特网”二级冃录即可获得有关该方面的所有网站信息。显然,这种按主 题、事物聚类的方法,对于用户按类检索特定主题特定事物的信息更方便直接。 直接用自然语言中的语词作为信息查询和检索的标识。由于搜索引擎分类冃录没 有严密的体系结构和人为标记符号,而采用的是超文本链接技术,使得类冃设置 较为灵活,一方而同一事物可以在多个类冃下重复列出,另一方面可以根据需耍 随时添加新的类冃,例如较“雅虎”在“政府与政治”类冃下设“十六大”二级 类。
3?类冃设置体现了以用户为中心,以人为本的理念。网络搜索引擎不刻意追求理 论上的严谨性,体系上的科学性以及结构上的严谨性类冃设置以尽量适合用户需 求为冃的,大多根据信息量与特定信息的被访问率来确定类冃的序列顺序及类冃 级别。类冃名称多是学科名词与主题词相结合的产物。这种列类顺应了网络信息 的特征。自然语言作为类冃名称迎合了绝大多数网络信息用户的需要,直观易懂。 如与经济学有关的内容在中文雅虎、搜狐等搜索引擎中都采用“商业与经济”、
“金融与投资”等老百姓常用的语言,日常热点的“娱乐”、“健康”、“旅游”等 占明确的一级类冃,充分体现了网络分类冃录自由灵活的特点。
1.3搜索引擎分类目录不足之处
不同的搜索引擎分类方法不同,缺乏统一的分类标准,分类体系无法兼容,令 用户无所适从。例姐“图书馆”在雅虎中被列在“参考资料”类下,而在搜狐中
“参考资料”则列在“教育与培训”类下,“图书馆”属于三级类冃。这种分类 标准不统一的情况,造成用户使用不同的搜索引擎感到无所适从,影响检索效率。
分类体系缺乏科学性。网络信息分类体系与学科及知识Z间缺乏必要的内在联 系。往往为了迎合大众口味生造类冃,破坏了知识体系的完整性。
3?类冃划分标准模糊,类名表述不统一。如雅虎中的“人文与艺术”与“社会文 化”、“社会科学”概念兼容,且为并列关系,不遵循学科Z间关系,类冃划分随意 性大,用户很难区别它们Z间的划分标准,检索极为不便。
4?类冃设置方面。类冃的设置忽视知识体系的完整性关联性、逻辑性,导致类H Z间逻辑关系混乱。首先,大类设置不科学。由于搜索引擎分类人员缺乏必要的 学科分类知识,只是为一般用户的使用而设计,例如网易共设18个大类,将“情感 绿洲”“少儿乐园”等列为基本大类,而“哲学”、“社会科学”却在大类中没有位 置。这种大类设置方法,对丁科学研究人员从学科角度检索非常不便。其次,类 冃设蜀不够全面,涵盖面窄。冃前,搜索引擎类冃最多也只有儿白个,难以反映 学科发展全貌。、系统性。体现在网络信息的分类体系对知识以及学科覆盖不到 位,用户使用网络分类门录进行检索时常感到部分信息难于归类。
用户研究现状
2.1网络目录的分类
通常采用2种方法,一是套用成熟的、权威的图书资料分类法,一是自行设
文档评论(0)