- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向Web3.0的分众分类研究 .doc
面向Web3.0的分众分类研究
[摘要]在全面分析y)是随着Web2.0而产生的新型网络信息分类法,也叫大众分类、社会分类、自由分类等,它就是由网络信息用户自发地为某类信息定义一组标签(Tag)进行描述,并最终根据标签被使用的频次选用高频标签作为该类信息类名的一种为网络信息分类的方法。其实质就是以词为类,但其类目却是平面的、非等级的,它是用户用标签对感兴趣的资料进行分类,并与他人共享标签的过程和结果。
2.1分众分类的优势
与传统网络信息分类方法相比,分众分类最大的不同之处在于,它并不采用严格的分类标准,其分类全部由用户直接提交,分类的形成过程完全是自发的。分众分类的主要机制基于“开放性元数据标准”和“自然语言社群聚类”。其优势主要表现在:首先,分众分类的标签形成过程充分体现了其自由性,任何用户都可以自由选择自然语言语词来对感兴趣的资源进行标注,从而可以从多个维度来揭示信息内容;其次,分众分类具备实时性与适应性,用户可以随时对其阅读或创建的内容和主题创建标签,并立即保存下来,并被允许即时快速的进行标签用语的修改;第三,分众分类为用户提供了共享标签的功能,任何人对内容进行标注后,他人可立刻看到这些标签,也可以点击这些标签,进而看到更多使用这个标签的信息内容,或是与此相近的内容。
2.2分众分类的局限
作为使用非控词汇的分众分类目前还存在一定的局限性,具体表现如下:
2.2.1标签的多样性 由于用户认知程度不同,对同一事物的揭示程度也存在很大的差异,导致不同用户在标注同一信息时使用了不同的标签,但是系统却无法创建这些标签之间的联系。标签的多样性极大的影响系统的检全率。
2.2.2标签的模糊性 分众分类是一种基于标签语法层次的简单聚合分类,因此,同一标签可能映射出不同语义的资源,而系统却不能识别出各个语义的不同。标签的模糊性使用户不得不花更多的时间和精力找到与检索标签相关的记录,因而影响到系统的检准率。
2.2.3标签的扁平化组织 分众分类的组织方式与传统的等级体系分类法组织方式不同,它是扁平化的,没有等级层次的划分。因此,系统无法识别各个标签之间的等级层次联系。一方面,这种由于标签缺乏等级控制造成的信息分散也必然影响了信息的检全率;另一方面,类目的平面非等级显示同样会隐藏一些有价值的信息。同时,信息越多利用标签直接找到相关信息就越困难。
2.2.4系统间的交互性很低 很多网络系统都具有标注资源和分享标签的能力,但是目前各个分众分类系统在语义表达和格式规范上并不一致,这不仅阻碍了各个系统之间的信息交互和代理软件的自动化处理,同时也引发了一系列检索方面的问题。另外,受语言、文化背景等因素的影响,跨国界、跨文化的分众分类系统之间的交互性更低。
2.2.5标签问语义关系缺乏 分众分类是以高频标签作为类目的一种信息分类方法,其分类结构是平面的,标签间是平等关系,缺乏对标签间的层次体系关系、属性关系和其他的复杂语义关系的描述,而标签间语义关系的缺乏不仅影响到检索的精准度,更重要的是对智能化搜索带来诸多障碍。
3 Web3.0对分众分类的需求 Web3.0的基础是Web2.0,因而,分众分类也是Web3.0的一种主要的信息组织方式。但是目前分众分类所具有的上述局限性显然阻碍了Web3.0的核心理念——“精准、个性和智能”的真正实现,Web3.0的发展需求决定了分众分类的发展方向,因而,未来的分众分类还需要在以下几个方面进一步拓展。3.1微内容的自由整合与过滤研究
微内容是ashup技术对用户生成的微内容进行整合,如何利用ONTO/RSS基础聚合技术对微内容进行有效聚合,从而使信息的特征性更加明显,为实现Web3.0的“个性化”打下基础。
3.2微内容的标准化与结构化研究
要实现Web3.0的跨平台、跨社区、跨语言的信息共享,需要对微内容进行标准化与结构化研究,提出一个通用的数据标准。这方面的研究主要包括微内容的拆分标准、属性选择、结构化表征、数据逻辑结构标准以及数据的存储结构标准等,其目的是使微信息之间实现互动,让Web完全可编程,从而满足复杂程序的需求,为信息在不同的应用平台之间的整合和传播提供支撑。目前,有关微内容的标准化和结构化的研究则仅限于企业网站的构建,如红门资讯在微内容的拆分、词义标准化和结构化等方面进行了深入的研究,其推出的公用信息平台已经实现了厂家信息、商家信息、品牌信息、文章信息等160多类信息平台间的自由互动。但目前整个IT行业中并没有一套完善的有关微内容的拆分、属性选择、结构化表示等方面的标准,这对实现整个互联网信息的无缝连接带来障碍。
3.3标注的规范控制研究
Web3.0核心理念之一
您可能关注的文档
最近下载
- 2025中级经济师《经济基础知识》三色笔记.pdf VIP
- GB/T 17215.321-2021电测量设备(交流) 特殊要求 第21部分:静止式有功电能表(A级、B级、C级、D级和E级).pdf
- Kollmorgen电机AKD驱动器手册中文版.pdf VIP
- 河南省九师联考2024-2025学年高一上学期11月期中考试地理试卷(含答案).pdf VIP
- 河南省九师联盟2024-2025学年高一上学期期中考试历史试题(含答案).pdf VIP
- 日立电梯MCA13中文注释版电气原理图.pdf
- 财务总监培训战略成本管理-战略成本管理.ppt VIP
- 战略成本管理 .pdf VIP
- 2024-2025学年江苏省无锡市锡山高级中学高一(上)月考物理试卷(10月)(含答案).docx VIP
- 江苏省梅村某中学2022年物理高一年级上册期末达标检测试题含解析.pdf VIP
原创力文档


文档评论(0)