基于多社交媒体的用户信息融合研究httpwwwcnsoftbeicom.doc

基于多社交媒体的用户信息融合研究httpwwwcnsoftbeicom.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于多社交媒体的用户信息融合研究/bencandy.php?fid=45id=1084 赛题简介:介绍整个赛题的思路和整体要求 ????信息融合起始被称为数据融合,起源于1973年美国国防部资助开发的声纳信号处理系统,其概念在20世纪70年代就出现在一些文献中。在20世纪90年代,随着信息技术的广泛发展,具有更广义化概念的“信息融合”被提出来。参考wiki的定义:信息融合是一个实时的连续的过程,它多层次、多方面地对多源信息进行探测、联想、估计以及组合处理,其目的是获得精确的被测目标的状态、一致性估计和完整的实时评价。 ????随着计算机网络信息技术的快速发展,云计算、物联网、移动互联网等新兴技术正在逐步改变人们生活方式,助推人类社会向着智能化的方向发展。在社交媒体领域,普遍都存在着单个个体同时使用多个社交媒体平台发布信息,如微信、微博、人人网等。这些信息在不同的社交媒体平台各有不同,而当前存在着单个个体在不同社交媒体平台上用户名不一致的情况,故而不能简单地根据用户名来进行信息融合。因此本题就是研究如何融合用户在不同社交媒体平台上信息的方法。? ????本题要求能够提出融合单个体在不同社交媒体平台上信息的解决方案,并进行原型实现。? 赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景???? ????当前,人们在网络社交媒体平台上发布着各种不同类型的信息,其中这些信息中包含着民航旅客对航空公司、机场等民航业的不同需求和喜好等内容。 ????中国民航局在十二五规划中,提出了构建全流程旅客服务体系。这就需要我们深化理解旅客的需求,在行程计划、预订、值机、机上等环节为主动为旅客提供所需服务。采用本题研究成果可以通过分析用户在不同网络社交媒体中发布的各种民航相关信息,综合用户对民航业的需求和体验,有助于完善航空公司对旅客需求的了解,积极主动为旅客提供(推荐)相关服务。 功能性需求 ????1.利用不同网络社交媒体提供的公开API获取用户的注册、发布等信息内容;??????? ????2.分析用户在不同网络社交媒体上发布信息的内容,清洗过滤非真实用户(机器人等)。 ????3.分析真实用户在不同网络社交媒体上发布信息的内容,研究用户在不同社交媒体上的行为特征。? ????4.利用真实用户在不同社交媒体上的行为特征,结合注册、发布的信息内容,进行真实用户信息融合。 非功能性需求 ????1.选取当前主流网络社交媒体(比如微信、微博、人人网等)进行信息清洗和融合,融合后的真实用户量达到10万量级。? ????2.信息融合的准率率达到70%以上,融合准确率定义为已经按用户融合的不同的社交媒体平台信息,确实为同一用户的概率。 其他限制条件:开发环境、实验平台、开发语言、数据库、编译器等限制条件???? 交付物:???????1.详细设计文档;???????2.测试报告;???????3.可运行应用及源代码;? 测试数据或平台:提供给参赛者的测试环境和测试数据。(可提供电子档) ????测试会严格概率抽样的科学方法对融合的用户进行校验。同时也会考虑提供部分已知真实用户的数据(一些敏感信息会进行漂白),用以当场测试。 其他要求 ????本次重点是提供融合不同社交媒体平台用户的方法,对于研究过程中融合的信息不做限制。 数据挖掘可视化技术 /bencandy.php?fid=45id=1092 赛题简介:介绍整个赛题的思路和整体要求 思路:? ??????大数据时代,通过数据挖掘,可以对数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从而提取辅助商业决策的关键性信息。但是,当前数据可视化工具的种类、质量和灵活性较大地影响了数据挖掘系统的使用、解释能力和吸引力。丰富而灵活的数据挖掘结果可视化技术使抽象的信息以简明的形式呈现出来,加深用户对数据含义的理解,更好地了解数据之间的相互关系和发展趋势。? ??????数据可视化技术凭借计算机的强大处理能力以及计算机图像和图形学基本算法以及可视化算法把数据转换为静态或动态图或图形呈现在人们的面前,并允许通过交互手段控制数据的抽取和画面的显示,使隐含于数据之中不可见的现象成为可见,为人们分析、理解数据、形成概念、找出规律提供了强有里的手。可视化技术已经成为数据挖掘不可或缺的一部分。? 整体要求:? ????数据挖掘结果可视化将数据挖掘后得到的知识和结果用以某种图形表现出来,其表现形式及交互方式可以非常丰富。用图形来表示数据挖掘结果,能使用户轻松地理解数据挖掘得到的信息,发现其中隐藏的特征、关系、模式和趋势等。 赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景 ????数据挖掘按照其功能以及应用来划分,主要有:关

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档