- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
微博营销之个性化推荐产品研究
个性化推荐产品研究
最近在微博上看到好几款做微博过滤的产品,跟两个月前自己的思路比较接近。但通过
最近一段时间的思考,有了一些新的发现和总结。
个性化推荐本来是一个技术性很强的话题,但本文重点仅仅讨论推荐过程中的“道
理”,不涉及任何深邃难懂的技术。本文的讨论主要以Zite和当前几款微博过滤产品基本
特征作为参照。为了避免不必要的争议,除新浪微博官方功能外,不指明其他具体产品名称。
一、基于SNS的Web阅读推荐
随着近年来技术发展,如自然语言处理,数据挖掘,机器学习等领域已经形成了一批可
工业化的技术,为高度个性化的内容推荐奠定了技术基础。
有了加工办法,还要有原料,才能做出产品。个性化推荐亦然。个性化推荐,无非就是
将用户可能喜欢的内容挑选出来呈现给他/她。而喜欢又受两个主要因素影响:(1)内容与用
户兴趣的相关程度;(2)内容本身的质量(热门度)。换句话说,就是需要知道用户是谁?
他喜欢什么样的东西?这个东西是不是用户喜欢的那些类型?
用概括性文字表述就是:
用户身份标识
用户的兴趣发现
内容的特征识别
非常庆幸,Social为个性化内容推荐提供了以上几乎所有的原料:用户有帐号标识自
己;用户的兴趣可以根据他的发帖,网络关系等历史行为数据挖掘获得;内容的类型特征可
以通过自然语言处理技术获得。这一切太完美了!
Zite,可以说就是这样一个生逢其时的产品,完美的将这些结合在了一起。通过输入
Twitter或者Google Reader帐号,Zite会分析用户的阅读喜好(兴趣),然后根据用户喜
好选取新闻/文章中与用户兴趣匹配度高的的结果呈现给用户,确实极大地提升了阅读的效
率和质量。
二、微博信息过滤和推荐
沿着上面的思路一路前行,似乎对微博这个正在趋于爆炸的信息宝库进行某种处理,根
据用户的喜好进行筛选过滤,推送用户关心的内容,会是一个不错的产品形式。但仔细思考,
会发现有两个问题有待解决:
1、 热门度
必须注意到一个现象:微博作为一种轻量级,参与度高的公开信息源。单从条目数量上
讲,微博每天的UGC数量可能比之前整个互联网一个月的产量还高,可内容却参差不齐!于
是,内容的质量成了一个问题。比如喜欢笑话的用户,推荐给他一个高质量的笑话,他会很
高兴;但同样是笑话,推荐一个质量平平的笑话,可能反而是一种垃圾信息。
可见,做微博信息推荐需要更加重视一个因素:内容的质量(热门度)。基于机器学习
等方法,目前自然语言处理技术在文本分类等工作的精度和效率,已经达到了工业化的标准。
但对于语义方面的识别和处理,还是很不成熟的。目前还没有任何自然语言处理技术能对一
段文章的观点、文采进行质量评估。靠谱的质量评估办法,还得依靠群众对文章的反馈来获
得,即热门度。
文章热门度的评估并不困难(特别对于微博),看看多少人对这条微博进行了评论和转
发就可以判定它的热门程度了。但微博作为一种实时性、瞬时性很高的 SNS产品,一方面
强调内容质量,一方面还有参与和粘性问题需要考虑。依赖专家型用户反馈的推荐系统,实
时性必定大打折扣。这也是为什么目前多款微博过滤、推荐产品的时序比较错乱的原因了(其
中包括新浪微博官方提供的兴趣阅读功能)。这自然牺牲了不少用户感受。然而Zite这种产
品形式对实时性要求不高,无须考虑这个问题。
2、 用户期望高
微博过滤和Zite阅读推荐还有一个差别。作为阅读推荐,只要把用户感兴趣的领域文
章中,选取热门度较高的一些推送给用户,就可以很好满足用户期望。如果漏掉了一些重要
的热门新闻,或者掺杂了少量用户并不关心的内容,只要具备一定相关性,都不会明显降低
用户的阅读感受。
但微博就不同了。微博用户的关注已经是用户初筛过的结果,他当然不希望漏掉这些用
户的任何重要信息;另一方面,作为过滤器形式存在的产品,用户对它的无关内容过滤能力
的期望也会相对比较苛刻。综合以上两点,微博过滤器的用户满意度及格线相对比较高!
3、 再谈热门度
除了热门度,还有一些难以具体化的因素影响着用户的喜好。例如:很多数用户可能会
有这种经历,一条转发量并不是很高的微博,却可能是我非常喜欢,非常认可的。SNS的一
个重要特征是,用户的喜好很大程度上取决于用户的好友们。用户对内容的认可程度往往依
赖于他对信息源的认可程度。你不得不承认,即使都是你关注的用户,在你心中的分量是完
全不同的。
问题是,
您可能关注的文档
最近下载
- 基孔肯雅热与登革热的区别与预防培训讲座PPT课件.pptx VIP
- 海船船员考试《船舶常识题库考点》模拟考试卷.doc VIP
- 海钓俱乐部商业策划方案.docx VIP
- 通桥(2021)5402-02客货共线铁路钢筋混凝土框架箱涵单孔孔径.pdf VIP
- GB_T 37356-2019色漆和清漆 涂层目视评定的 光照条件和方法.docx VIP
- 2025年农村饮水安全工程监理实施细则.doc
- 课件:针刀治疗颈椎病——钟吉富.ppt VIP
- 校园膳食监督家长委员会制度.docx VIP
- 2025上半年信息系统项目管理师(高级软考)综合知识真题及解析.pdf VIP
- 坚持改革开放--==部编版道德与法治九年级上册.pptx VIP
文档评论(0)