- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分析:如何用数据管理内容
论文类别:计算机?-?网络营销上传时间:2015/9/2?11:41:00论文作者:未知?
?
讯:知乎已经走过了4个年头,在互联网的世界里,知乎已经成为无可争议的高质量社区,但在经历了高速发展之后,如何管理,筛选,呈现这些大量的信息(数据)成为一个难题,事实上无论对于哪一个社区而言,数据的管理本身就是一个巨大的挑战。下面是知乎联合创始人在七牛大会上的关于知乎数据方面的演讲,稍作删减。
大家好,我是知乎的李申申。首先,我想对主办方说一声:谢邀!感谢你们搭建这样一个专业的平台,让大家有机会聚在一起认真讨论数据这个话题。
说实话,在接到大会邀请的时候,我第一反应想到了这句话。
如同Dan?Ariely所说,知乎也像是众多面对大数据很懵懂的“年轻人”之一;我们虽然也在做大数据相关的一些事情,但其实比较粗浅。我听说今天在座的各???有不少都是知乎的用户,对知乎有一些兴趣,那我就借这个机会跟大家分享一下知乎数据方面的一些工作。
简单进入正题,我们先来看看知乎的基本数据情况。
今天的知乎截至2015年7月,知乎社区已拥有2900万注册用户,月UV1.1亿,月累积页面浏览量达3亿。现在知乎全站已累计产生约620万个问题,以及近2000万个回答。用户总回答4,129,244,445字数,是大不列颠百科全书的近100倍,鹿鼎记的2580倍。
除了以上比较基础的数据,一些其他方面的数字也在以令我们比较欣喜的速度发展着。我们截取了知乎开放注册以来,获得一千个以上赞同的回答和千字以上的回答两个数据,看一下它们的增长情况。可以看到,这两项数据都是保持了一个比较平稳的增长趋势的。再看一下,这些用户日均获赞的数量。
首先,必须说明的是:我们并非完全将这两项指标作为有价值回答的判断标准,但是当用户愿意静下心来花时间撰写长文回答的时候,至少他的态度是认真的,也符合知乎所倡导的讨论理念。另一方面,知乎上的千赞代表了1000位知乎用户对此回答的认同和接纳。除开2月份等过年过节的时期数据会略低些,其他时间,这一数据增速基本都保持在10%左右。
同样基于话题这个维度,我们随机抽取几个话题看最近的用户讨论趋势。
这里展示的是心理学、互联网、经济以及天津爆炸这几个话题。值得注意的一点在于,在天津爆炸事件席卷几乎所有社交和舆论平台,非常聚焦地引起爆炸性的关注时,知乎站内的其他专业话题讨论依然在持续进行。同时,由于天津事件后续的各讨论环节中有不少涉及心理学的疑问,因此,知乎站内心理学的话题热度也被带动着略有上扬。
综合看,现在的知乎更像是个广场,各类较为热点的时事讨论好像是广场中央的喷泉,吸引了游客和大众的关注目光。而与此同时,在广场四周也有着各色酒吧、咖啡馆和茶馆等,各自汇聚了城市的居民们与知己倾心交谈。
知乎大V和知乎小白有不少知乎用户曾有疑虑,是否只有早期的用户们才较为认同知乎的社区理念,又或是只有老用户们容易收获赞同和关注?其实并不尽然。
让我们一起看看以下几组数据截图,横轴为时间变化,我们截取了2010年12月20日知乎内测以来到2015年6月30日赞同数前10000的用户,根据他们的注册时间和赞同数作图,以及日均的赞数增长量。大家可以看到这些点分布的比较散,说明增长情况比较均匀。
可以看出:即使在2015年才刚加入知乎的人也有非常大的机会被关注和认可。这也说明,这些新用户也有认真讨论、获得有价值信息交换的渴望,这些用户也是非常认同知乎的社区理念的。可以通用的秘诀在于:只要坚持不断地在自己擅长的领域参与讨论、输出信息就能得到更多人的认可。
知乎信息如何生产,以及如何流动?前面几张图,我们已经了解了知乎的百花齐放的话题和持续贡献的优质用户。下面我们来看看知乎信息生产方式,为了更聚焦的展示这个问题,我们选取了近期的天津爆炸事件作为事例。
从发展方式来看,热点话题与其他话题相比,并没有不同。但是由于其新闻性,这类话题的发展更具有爆发性,用户的行为更为集中。因此,也更方便我们来做这样一个展示。
首先,一批用户针对问题进行关注、回答,产生了基础的优质内容,然后,其他用户的自发邀请、关注、收藏、感谢、投票、评论等社交行为,使得这些内容获得了更广泛的传播和关注,覆盖的人群不断扩大。
在知乎,社交行为催生了优质内容的生产与传播,而优质内容又引发了下一轮新的社交行为。
如何用大数据做用户兴趣识别?用户在知乎上的行为是多维度的;既包括比较轻的浏览阅读,又包括重一些的赞同、反对,还有更重的提问回答(这里的重和轻是根据用户操作成本来界定的)。我们可以根据这些行为做用户的特征分析,这也是各个互联网服务都会做的常规工作,只是基于各自不同的服务特点,所要分析的特征、采用的算法及其效果各有不
您可能关注的文档
最近下载
- EXC9000励磁系统简介.ppt VIP
- 状语从句时间状语从句.pptx VIP
- 2024山东城市建设职业学院招聘笔试真题及参考答案详解.docx VIP
- 13685光与色彩自考课程.docx VIP
- 2024年山东城市建设职业学院招聘笔试真题附答案详解.docx VIP
- 重症自身免疫性脑炎监测与治疗中国专家共识(2024版).pptx
- 2024山东城市建设职业学院招聘笔试真题附答案详解.docx VIP
- 商用车推力杆多自由度动态载荷耐久试验方法201106.pdf VIP
- “体文旅”融合发展:概念重构、内涵解析与演进历程.docx VIP
- 《检验检测机构资质认定评审准则》试题及标准答案.docx VIP
文档评论(0)