- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
报告:社区类产品潜在用户研究
样本整体描述
样本整体描述
本次研究采用线上问卷和检索日志相结合的方法。线上问卷的数据来自mp3首页2006年7月5日至2006年7月13日的问卷调查,共收集到问卷2544份。删除没有cookie的样本,共剩余2455个样本。跟踪填答问卷用户的cookie,获得以上用户从2006年8月5日至2006年8月29日,共计25天的网页搜索检索日志。
需要说明的是,由于本次数据的cookie来自mp3首页,应该考虑到的是mp3的用户并不能完全代表百度的所有用户。从艾瑞的iUserTracker数据可以看到,大约有54.3%的百度用户使用百度mp3,也就是说本次调查的数据并不能准确反映剩余45.7%的百度用户的检索行为。在解读数据时这个因素是需要被考虑进去的。
???????????????????????????????????? 图1:百度主要服务用户月度到达率
当然这种判断标准主要来自于主观的经验判定,可能并不绝对合理。尤其是总检索量大于3000这一标准,很可能把一些检索次数非常高的用户剔除在外。但考虑到本次研究将一个cookie假定为一个用户,多人一机时的检索数据将对分析结果造成较大影响,因此在检索量上限的设定上采用了较为严格的标准。
在确定有效样本后,对他们的检索词进行分类,共计4大类,54小类。标注词占总检索词的覆盖率为69.3%,对标注词的检索量占总检索量的覆盖率为80.6%。具体数据见下表:
标注词 所有词 覆盖率 个数 163050 235334 69.3% 检索量 440884 547213 80.6% 表1:研究标注词的覆盖率
标注检索量(去翻页) 百分比 1 网址/网站 7061 10.87% 2 游戏 6706 10.32% 3 音乐 6214 9.57% 4 教育培训 5404 8.32% 5 影视 5204 8.01% 6 性/情色 3078 4.74% 7 p2p软件 2995 4.61% 8 明星 2734 4.21% 9 小说 2060 3.17% 10 企业/行业 2039 3.14% 表2:检索量前十名的检索类别
用户检索行为聚类分析
根据用户检索三大类别内容(娱乐、消费、信息)上的偏好,将用户聚为两大类六小类。具体类别及所占的人数比例见下表:
两大类 六类人 平均检索次数 人数比例 娱乐 消费 信息 没有明显的内容偏好 三类检索都非常高 336.11 54.02 122.19 55.43% 7.09% 三类检索都比较高 36.93 10.71 17.08 19.10% 三类检索都很低 1.86 1.19 1.40 29.23% 有明显的内容偏好 偏向娱乐内容的检索 17.08 1.28 2.24 44.57% 19.83% 偏向消费内容的检索 6.62 8.00 2.14 11.43% 偏向信息内容的检索 3.85 3.75 14.32 13.31% 表3:用户检索行为聚类特征及比例
除了检索量,我们还将用检索的平均字节数和平均会话检索次数这两个指标来描述用户的检索行为。平均字节数指的是用户平均检索一个词包含的字节数,能够反映用户倾向用更宽泛地检索还是更精确检索。从统计数据中我们发现,倾向检索信息内容的用户平均检索的字节数最长,也就是说检索信息类内容需要用户给出更为精确检索Query。
平均会话检索次数指的是在一个session里面用户的检索次数,代表了用户围绕一个信息主题会进行多少次检索,从一定程度上反映了用户对这个主题的关注程度和用户的检索技巧。通过统计数据,我们发现检索量越大的用户,平均会话的检索词也越高。这说明了,检索量高的用户一方面是由于其关注的主题广泛,另一方面是由于其检索一个主题时进行的检索次数也高。具体统计数据见下表:
六类人 总检索量 平均字节数 平均会话检索次数 三类检索都非常高 1117.26 11.39 4.74 三类检索都比较高 174.19 11.77 3.99 三类检索都很低 6.30 11.49 2.75 偏向娱乐内容的检索 39.11 10.90 3.61 偏向消费内容的检索 41.74 10.73 3.55 偏向信息内容的检索 48.99 13.10 3.96 表4:六类检索行为的检索特征
结合问卷数据,我们可以比较六类人在人口统计变量上的差异。具体数据见下表:
六类人 年龄均值 教育程度均值 收入均值 男性比例 已婚比例 学生比例 三类检索都非常高 20.04 2.24 3.19 77.55% 6.12% 46.94% 三类检索都比较高 21.26 2.39 3.38 67.44% 9.30% 44.96% 三类检索都很低 20.66 2
文档评论(0)