A10487127华中赛A题一等奖论文.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三届华中地区大学生数学建模邀请赛 题目:基于模糊理论与 BP 神经网络的论坛用户识别模型 【摘 要】 本文采用模糊理论和神经网络理论,建立数学模型,实现了互联网论坛用户 的识别。 针对言论领袖的识别,根据模糊理论,利用软件采集数据,采用精华帖数、 发帖总数等为评价指标,建立一级模糊评价模型,得到用户 “周小福”等是论坛 的言论领袖,定义言论领袖指数,并做性能分析。 针对活跃用户的识别,采用日均发帖数、登陆频率为指标,对上述模型进行 改进,建立二级模糊评价模型,得到用户 “小帅”等为论坛的活跃用户,对各指 标的权重做灵敏度分析, 得出是否为活跃用户对权重不敏感以及活跃指数对日均 发帖数敏感的结论,定义用户活跃指数,并做性能分析,对模型一和模型二的结 果做比较分析,得到言论领袖和活跃用户具有一定联系的结论。 针对话题用户的定位,从用户的发帖内容和数量出发,利用采集到的数据, 根据模式识别的原理,建立 BP 神经网络模型,利用 MATLAB 编程求解,得到用 户 “月影星稀”对美食主题特别感兴趣等结论,并对神经网络模型的性能进行了 分析。 针对关系圈的确定, 考虑同一个关系圈内的用户对话题的关注行为具有相似 性,采集数据,根据模糊理论,建立模糊聚类模型,编程求解,得用户 “popo” 、 “兔子闹闹” 、 “小美人鱼” 、 “XGG”和“realvenus”在一个关系圈内的结论。 最后,对已建立的模型进行综合,得出通用模型,给出技术文档,说明了模 型的使用方法。另外,给出了综合性的结论和模型的优缺点。 关键词: 模糊评价  BP 神经网络 模糊聚类 2010 华中数模邀请赛一等奖论文  0  一. 问题重述 随着互联网领域的高速发展, 互联网论坛已经成为了互联网用户之间十分重要 的互动平台,近几年的调查表明的论坛用户需求多元化,用户互动交流渐趋立体 化等特点使得许多商业机会应运而生,当然一些运营难题也接踵而至。 如何在日益转型的互联网论坛中获取商机, 其关键的一点就是从浩大的信息库 中有效的识别和挖掘出有用的信息。信息技术广泛应用的同时带来了信息的泛 滥。如何从大量的数据中快速有效地提取用户需要的信息和知识显得越来越重 要,如何让用户不至于被信息的海洋所淹没;如何利用多年信息系统积累下来的 大量数据,从被深埋的历史数据中挖出财富;如何解决信息化建设过程中,由于 历史的认识水平和技术条件的限制所造成的信息化各子系统的脱节而直接导致 的信息孤岛问题。以上多是当今企业和政府的信息系统迫切需要解决的问题。而 论坛用户的识别是一个经典的数据挖掘问题, 如何迅速有效的对某一个或某一类 用户进行定位,识别其身份,将有助于更有针对性的把握商机。 这里我们要解决的问题是: 从论坛一些基本信息切入, 发现论坛言论领袖, 识别最有影响的论坛人物。 建立适当模型识别论坛活跃用户。 大体识别话题用户的范围。 根据帖子基本信息发掘论坛用户的人际关系圈。 二. 问题分析 首先,对于言论领袖和活跃用户的识别应该属于同一类问题,而话题用户和关 系圈的挖掘属于另外一类问题。我们在论文中首先考虑这两个问题,影响一个用 户成为言论领袖的指标主要包括:跟帖数量、精华贴数、置顶时间、发帖总数、 页面总访问量等, 而对于一位活跃用户而言, 关系较为紧密的指标为: 登陆频率、 参与话题数、日均发帖数、积分等,通过对这些指标的分析,我们可以较为有效 的对用户进行评价。其次,对于话题用户的识别,则需要一定的经验数据用来发 现用户的行为和用户特别关注的话题之间的关系。最后,对于关系圈的划分:据 有一定关系的用户,在行为上必存在某种相似,故它们可以通过某些方法被划分 为一类。 三. 模型假设  1.收集到的数据真实有效。  2.论坛和用户的选取基本体现了模型的通用性。  3.版主或管理员可以被看作言论领袖和活跃用户的代表者;  4.处于同一关系圈的用户在行为上存在相似性;  5.互联网论坛的发展处于正常状态,在一定时间内不会出现大的变化。

文档评论(0)

godaddy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档