- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
短信种子用户精准识别
短信种子用户的精准识别
摘要
本文通过对题目所给的用户短信发送情况的数据的分析和筛选,选取特定时间段的用户短信发送情况进行评估,利用层次分析法确定每个评估指标的权重,综合计算出每个潜在短信种子用户的得分。再根据每个用户的综合得分确定最终的短信种子用户。
对问题一,我们首先利用SQL server 对题目所给数据进行处理并绘制出统计图像。观察可知在2月6号和14号两天,用户发送信息的数量远远大于其它时间段。因此我们以每个用户在2月6号群发短信量,2月6号短信被转发量,2月14号群发短信量,2月14号短信被转发量作为短信种子用户的评估标准。
对问题二,我们对筛选后的数据利用归一化的方法将用户在各个指标上的得分求出,然后利用层次分析法计算出每个用户的综合得分。最后,我们以0.5作为门槛值,确定最终的短信种子用户。最终得到用户1322919、1301510等为短信种子用户。
对问题三,此次模型求解过程中,我们使用了SQL软件及Access软件进行数据的提取及筛选,但由于数据量过大,处理过程较为麻烦,所以若超过2000万用户,还是应该选用功能更加强大的数据处理软件。这样可以大大优化计算过程。MATLAB编程其实并不复杂,运算过程处理也较快。计算的复杂度,我们运用数据结构中的复杂度的思想,MATLAB编程中有两次for循环,定义复杂度为c=50*4=200,若数据为K个,则c=4k.
问题重述
每逢佳节,一些人会自创或下载节日祝福或幽默短信并群发给其他用户,收到此类短信的人有时也会随手将其转发给其他亲朋好友。有些颇具创意的短信可能会引起大量的转发,其中短信种子用户起到了重要的作用。
所谓短信种子用户,又称“短信领袖”,他们在大量发送短信之后,能引起接收者的大量转发,形成强大的传播能力。请根据附件所给用户信息,建立数学模型,解决如下问题:
1.1设计短信种子用户的评估指标体系;
1.2结合评估指标设计评分标准,对本运营商的各用户的短信传播能力进行评分,从中筛选出符合要求的种子用户;
1.3当前的数据量只是某城市的部分用户,假如对某省份的全量用户(超过2000万户)进行挖掘,当前算法是否需要优化。并结合现有数据估算全量用户的计算复杂度。
模型假设
2.1.假设用户某次群发短信所需时间在3分钟内,并且在此期间用户群发短信的数量大于等于50条,即短信发送时间大于3分钟,群发数量小于50条的用户不作为短信种子用户。
2.2假设若某用户在收到短信5分钟之内向其他用户进行了短信群发,则认为这个用户转发了前一用户的短信。
2.3假设前一用户发送短信的时间即为后一用户接收短信的时间。
符号说明
符号 符号说明 手机用户 2月6号 用户群发的短信数量 2月14号 用户群发的短信数量 2月6号 用户转发的短信数量 2月14号 用户转发的短信数量 用户在某指标上的得分 一致性指标 平均随机一致性指标 一致性比率
问题分析
根据题意,我们需要建立一个数学模型来对短信种子用户进行较为精准的识别。题目中说到短信种子用户会在节假日群发祝福短信,并引起其他用户的大量转发。我们将题目所给的用户短信统计数据利用SQL Server进行了筛选,发现2月6号、14号,即元宵节和情人节,这两天用户短信发送量明显大于其它时间,因此我们选取这两天的短信发送情况作为研究对象。
第一问,我们要设计短信种子用户的评估指标体系,主要以用户群发短信的数量和短信被转发的数量为评估指标,通过加权得出评定结果。根据人们的日常生活习惯,可以假设当用户在3分钟内发送给不同的用户的短信数量不小于20条时,该用户可被视为潜在的短信种子用户。将某用户在3分钟内发送的短信条数,作为该用户的节日群发短信量。如果他在一天内的多个时间段内群发了短信,我们取其发送短信量最大的一次作为该用户的节日群发短信量。
模型的建立与求解
5.1数据的分析
通过SQL server软件对题目所给的2月份用户短信发送情况进行统计,并导入到Excel软件中绘制出统计图如下:
通过观察在图像,我们很容易发现在2月6号、14号这两天用户的短信发送量明显大于其它日期。因此我们认为在这两天时间内大量群发短信的用户具有成为短信种子用户的潜力,即选择这两天的情况作为研究对象,进行模型的计算。
5.2对评估指标的解释
5.2.1用户发送的短信数量
一般地,手机用户在进行短信群发时会选择两个或两个以上的收件人,而在发送节日祝福短信时选择的收件人会数量更多。考虑到这一点,我们可以认为用户在3分钟内连续发送的短信数目越多,其成为短信种子用户的可能性越大。
5.2.2 短信的转发数量
考虑到实际情况,我们假设若某用户在收到短信5分钟之内向其他用户进行了短信群发,则认为这个用户转发了前一用户的短信。
5.3 模型的建立
您可能关注的文档
- 浅谈济南企业销售人员流失原因及对策(论文).doc
- 浅谈护理带教工作体会_Microsoft_PowerPoint_演示文稿.ppt
- 浅谈企业留住人才的举措.ppt
- 测绘行政执法.doc
- 津贴、补贴奖金福利管理.ppt
- 法国结婚礼仪风俗.ppt
- 测评标准体系的类型.doc
- 沃神脑开幕庆典.ppt
- 浙江2014年会计从业资格《财经法规》名师押密卷第一套.doc
- 浙江省温州市苍南县2012年教师招聘公告.doc
- 8 黄山奇石(第二课时)课件(共22张PPT).pptx
- 22《纸船和风筝》教学课件(共31张PPT).pptx
- 17 松鼠 课件(共23张PPT).pptx
- 23《海底世界》课件(共28张PPT).pptx
- 21《大自然的声音》课件(共18张PPT).pptx
- 第12课《词四首——江城子 密州出猎》课件 2025—2026学年统编版语文九年级下册.pptx
- 第2课《济南的冬天》课件(共42张PPT) 2024—2025学年统编版语文七年级上册.pptx
- 17 跳水 第二课时 课件(共18张PPT).pptx
- 第六单元课外古诗词诵读《过松源晨炊漆公、约客》课件 统编版语文七年级下册.pptx
- 统编版六年级语文上册 22《文言文二则》课件(共27张PPT).pptx
原创力文档


文档评论(0)