- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
微内容序化方法和应用实例
微内容序化方法和应用实例
[摘要]以Web2.0技术产生的微内容杂乱无序、难以利用的问题为出发点,应用信息组织理论和序化思想,研究如何对微内容进行汇总、序化加工,形成有序的、易于理解与利用的综合信息,包括:设计对微内容加工的方法,构建Web2.0信息加工框架,为Web2.0网站建设及改进提供依据,并探索微内容信息利用的方式。
[关键词]微内容 序化 指标 信息加工
[分类号]G203
Web2.0技术使普通网民成为信息的接收者和信息的提供者。但是,广大网民提供的Web2.O信息(简称微内容)呈现无序化、去中心化的特点。对网民来说,序化的微内容是更有意义、更有利用价值的,因此微内容序化和中心化成为新的研究问题。
Cmswiki将微内容定义为:“微内容包括个人所形成的任何数据:比如一个简单的链接、一篇网文、一幅图画、一段音频、视频、收藏的书签、喜爱的音乐列表,等等”。熊回香认为,微内容是指在网络上至少拥有一个唯一地址或编号,以及只含有极少数中心概念的元数据和元数据的有限汇集。
序化即增加系统的有序度,是指系统的所有组成元素按照特定的逻辑法则进行顺序排列的过程。张如法认为,有序化是指发现事物或现象之间的各种联系,而将它们作一定的排序和连接。信息序化,又称为信息整序,和信息组织的概念密不可分。吴华欣、于雄杰指出,社会信息的生产和流通具有无序性,主要特点表现为信息从局部上看是有目的、有计划的,但从整体上看则不然。这种无序性对信息的利用造成了极大的障碍。王松林认为,信息序化就是通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
在应用方面,如何挖掘微内容的商业价值也逐渐成为研究的热点。Chen和Xie认为,微内容是由大众知识导向的,对其进行加工而得到的信息产品,对企业有重大的商业价值。当无序、杂乱的微内容被加工后,Tam和Ho认为,这些信息产品就可以极大地影响普通网民和企业的认知和决策。
1、微内容的分类
根据微内容的表现形式的差异,将传统的微内容概念进行扩充,分为信息微内容和用户微内容两类。信息微内容即传统意义的微内容,包括用户创造的记录、对其他微内容的评论等。同时本文将用户微内容定义为:在网络中,标识每一个用户的多个角度的元数据集合。
“用户”指在Web2.0网站中发布过微内容的用户(简称信息提供者),区别于普通网民(个体序化信息接受者,简称个体接受者)中不提供信息的用户,例如只在Web2.0网站浏览而不生产内容的用户,和对Web2.0信息有更高层次需求的企业序化信息接受者(简称企业接受者)等,如豆瓣网和优酷网。
相比于信息微内容,用户微内容有特定的结构和意义(如用户的注册信息等),但如果不对这些孤立的信息进行序化加工或信息组织,就没有实际的应用价值。将用户微内容与信息微内容区分为不同类型,一方面可以对用户信息进行序化,这同样应作为Web2.0信息序化必不可少的一部分,尤其在社交网站中应用较多;另一方面,由于网络中存在部分用户借助Web 2.0平台发布广告、虚假信息或不负责任的评论等,用户微内容在过滤这些信息的创造者方面亦发挥重要作用。
Web2.0用户分类和微内容分类如图1所示:
综上所述,用户微内容来自Web2.0用户中的信息提供者自身,信息微内容来源于信息提供者发布的Web2.0信息。将这两部分微内容进行序化加工之后得到的序化结果,可以被两部分Web2.0用户所使用——作为个体接受者的网民注重从微内容中获得清晰、有序的信息,企业接受者则注重从微内容中得到具有商业价值的信息。
2、微内容序化指标
微内容是杂乱、无序的,微内容的序化即通过一定线索将杂乱的信息进行整合,从一个或多个维度将信息组织在一起,使孤立的信息处于不同维度的信息序列之中。这些维度就是对信息序化加工的依据,即微内容的序化指标。经过对多个主流的Web2.0网站的微内容进行汇总和抽象,可以发现,虽然各个网站的序化指标的名称各有不同,但本质上主要包括以下方面:
2.1 用户微内容的序化指标
2.1.1 用户基本信息 用户基本信息是最基本的用户微内容序化指标,一般是在注册时就需要用户提供,如姓名、性别、单位等,方便网民在Web2,0网站建立自己的人际网络。
2.1.2 标签 标签的内容是任意的。通过标签,可以构建一个多维的超空间(一般标签可以最多设置8至10个),每个用户都是这个空间的一个多维交叉点,在用户基本信息之外设置了新的用户序化角度,使用户在杂乱的Web2.0用户群中快速发现感兴趣的结果。
除了用户基本信息,还有很多指标可以刻画用户的网络行为特点,比如用户可信度、活跃度
文档评论(0)