基于微信公众号个性化新闻推送平台设计与实现.docxVIP

基于微信公众号个性化新闻推送平台设计与实现.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于微信公众号个性化新闻推送平台设计与实现   摘要:本文设计并实现了一个个性化新闻信息浏览与推送功能,利用网络爬虫合法抓取其他网站提供的rss内容,把聚合的内容重新整理成个性化信息利用微信公众号推送给不同的用户群体。在本文中,主要阐述了完成这样一个平台需要实现的业务逻辑和服务执行逻辑。   关键词:网络爬虫;个性化推送;新闻;微信公众号   中图分类号:tp393文献标识码:a   文章编号:1009-3044(2019)36-0015-03   在信息化时代,紧张的生活节奏使得人们对于新闻的关注程度大大降低,但使用微信[1]的人却越来越多,微信公众号又提供了丰富的网页接口给第三方平台,可以方便地与用户进行交互,利用这个特性,可以开展基于微信公众号的个性化新闻推送服务。   在目前的推送服务产品中来看,推送服务大部分都是app的附属产物或者面向电脑端的服务[2],而且几乎都是对自身平台的数据进行推送,对于消息聚合再对用户进行推送的平台发展得非常好的是百度app,对文章内关键词,新闻头条等分析非常准确,因为基于搜索引擎行业的多年的积淀表现比较亮眼。而如今的微信公众号大部分都是通过发表推文吸引读者关注和阅读,做个性化信息推送的公众号较少,而qq看点,百度推荐,今日头条多是其平台白己的文章,信息渠道较窄,存在商业竞争情况下,信息往往不全,无法有效聚合信息。   利用微信的用户快速推广用户群体,而且在内容优质的情况下使用微信作為介质可以提高用户黏性,可以简化用户对于自己关注部分的新闻浏览。目前使用微信公众号作为介质做聚合内容的智能推荐平台的厂商非常少,传统的智能信息推送平台基本无法做到多平台聚合内容,用户使用纯移动端网页无法做到不错的用户体验。有的商家为了推广app,甚至强制用户使用app才能体验全部功能。开发这样的基于微信的新闻推送系统让用户可以随时查看自己所关注的文章或新闻又不需要额外安装其他的app为移动端的新闻阅读带来极大的方便。   基于微信公众号的个性化新闻推送为关注了该微信公众号的用户提供一个推送平台,根据用户的兴趣去搜集信息并定期推送给用户[5]。使用微信公众号进行平台的推广和运维,从管理者角度来看更便捷;从开发者角度来看可省去用户注册的麻烦,但开发者对用户管理模块的开发及维护成本却高于正常开发。但新领域新平台与微信公众号进行对接可以更快速让更多的更大用户群体接纳,也可以拓宽微信公众平台的业务多样性。   本文提出的个性化新闻推送想,利用了目前的多数互联网新闻平台提供rss接口[4]。该接口是一个简易信息聚合,基于xml标准的一种规范,个性化新闻推送系统利用这种规范使用爬虫技术[3]合法的抓取新闻平台的文章摘要信息。再通过用户个性化特点推送给相关用户。   1系统总体框架   本系统由爬虫自动爬取选定的rss源所提供文章,然后系统进行分析处理后根据用户个性化特点进行推送。文章的rss源由管理员手动维护,将需要rss订阅入口链接添加至系统中,系统的rss爬虫服务会自动运行抓取rss源中的文章信息。整个系统框架流程见图l。   系统采用php7.0和thinkphp5.oc5]框架进行开发。php是目前小型网站开发与搭建的首选语言[6]。thinkphp则则是一个基于php的mvc开发框架,它自己有提供模型层和控制器完整的接口,也有一套完整的模板引擎,在开的时候仅仅使用一个框架就可以完成mvc的所有层次[7][8][9]。前端采用layui,其有着自己的模块定义和引用方式,强大的弹出层和丰富的官方组件使得开发变得更快更好[10]。   2新闻文章的获取   公众号推送的文章来源于别的新闻网站,如果直接从别的地方抓取文章,不同的网站不能使用同一套规则,而且网站一旦改版,规则也要重新进行修改,平台的维护需要开发人员,这导致开发和维护成本会非常高。大多数新闻网站都支持rss协议的文章输出,利用这个协议,可以实现只写一套规则就可以抓取所有服务列表中rss站点的文章了。维护方面就只需要管理员将rss源的链接添加至平台中。从列表中查询出rss最短更新周期的配置,然后根据这个值,查询最后更新时间在刚刚查询出来的结果时间前的所有记录。再调用爬虫方法去抓取远程服务器的列表数据,返回结果为一个xml格式的数据,但需要比较复杂的流程去处理编码问题。经过处理后,将文章信息读出并储存。文章信息包括链接、标题、内容描述、作者、发布时间等信息。爬虫工作流程详细可见图2所示。   3个性化推送服务   微信公众平台目前分成消息接口和通用接口两大模块[11],本服务使用的是消息接口中的微信客服接口,内容需要做到个性化,所以不能使

文档评论(0)

软件开发 + 关注
官方认证
服务提供商

十余年的软件行业耕耘,可承接各类需求

认证主体深圳鼎云文化有限公司
IP属地陕西
统一社会信用代码/组织机构代码
91440300MA5G24KH9F

1亿VIP精品文档

相关文档