- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于通信数据的移动用户行为分析.
基于通信数据的移动用户行为分析
[摘要] 认为分析移动用户行为特征与分类,对移动应用个性化服务的改进具有重要的参考价值。基于国内电信运营商随机抽取某市一万移动用户一周的日志记录,其中含有4万余条通话记录和200余万条网络请求,每条请求包含对应的基站标号以及基站地理位置。本研究从消费能力、通话量、网络请求量、位移量四个维度从这批数据中提取14种基本特征指标。利用K-Means聚类方法将移动用户区分成规律通话型、随机上网型、居家节约型和随机高消费型等四类用户模型。
[关键词] 用户行为分析;移动用户研究;聚类分析;数据挖掘
[分类号] G35
1 引言
随着移动通信技术的迅猛发展和广泛应用,移动终端大量普及于民众,也产生了大量用户信息记录,如何利用大数据来了解移动用户行为与习惯特征的研究不断涌现。通过对移动用户的分析与了解,许多企业与政府部门可以依据结果提供各式各样的服务与应用方案。移动用户行为分析通常是指基于地理信息涉及用户访问网络、通话的行为规律与活动研究。电信运营商通过获取用户访问移动互联网、使用移动应用及通话的行为规律,能够有效地配置网络资源并提供具有针对性的服务。
近年来,针对桌面端日志挖掘的研究层出不穷,[15, 16, 17]都是针对桌面端web服务的后台日志挖掘入手,通过分析用户访问页面的占比、用户访问的页面顺序等对用户的行为进行建模。而针对移动用户的行为分析研究则在很多方面借鉴了桌面端的研究,同时利用移动端设备的地理位置位置记录,挖掘出用户移动轨迹模式,找出轨迹中重要的位置并结合通信数据、互联网日志数据以及移动应用数据作为研究的基础,分析挖掘移动用户的需求、行为、兴趣,甚至是通过预测用户的目的地、推测用户下一步即将到达的位置以便提供针对性的推荐服务[1, 13]。传统的移动用户轨迹分析,多数利用软件采集仿真数据,属于细时空粒度下的数据,即可以采集到用户一天中连续时间段的位置数据。Y.Zhu等作者着眼于用户位置数据中经常出现的地点,并根据出现时间来推测用户所处的位置是家还是公司[2]。此外,S.Akoush和A.Sameh则通过指定时间粒度,聚类用户在多日同一时间段的行动轨迹,利用稀疏数据拟合出用户在这时间段移动轨迹的目的[3]。研究用户的移动轨迹,实现预测用户下一步位置目的的方法,包括利用贝叶斯算法、聚类、数据挖掘方法等。实际上,电信运营商服务器上的数据是粗时间粒度的,唯有请求通信或上网时才会被记录,因此用户位置变化是不连贯的,具有随机性、稀疏性的特点,不能支持用户行为轨迹直接且连续的刻画描述。谭均元等人提出了生活熵概念作为用户移动轨迹规律程度的度量[4],采用了个人多天时段移动序列的算法来弥补实际数据的这种不足,即通过对多天数据的分析来获得更准确的用户移动轨迹。S.A.Shad则结合地理信息与用户提供的上下文语义信息来增加预测准确性[5]。梁鹏等作者则透过在WAP网关进行数据采集,并对数据进行数值分析和拟合,最后得到用户行为的统计性特征来建立用户行为分析模型[6]。吕洋利用上网数据研究用户的网络请求行为、时间、网页应用、数据包大小等信息建立用户行为模型[7]。Y.Liu关注于移动用户上网过程中访问频率、访问时间、访问深度之间的关系[8]。G.F.Zhao等作者则利用二分网络模型来分析移动用户上网过程中用户与不同网站之间的关联。对移动用户上网请求过程中数据包的大小、请求响应时间等的研究也是与运营商相关的研究方向[9, 10, 11, 12]。由此可知,国内外对移动用户行为的研究呈现向上的趋势,研究的方法也越来越多样。
笔者基于运营商提供的移动数据,提取用户特征,并将选取的特征作为聚类分析的输入参数,以发现具有不同行为特征的用户类别。利用消费能力、通话量、网络请求量、位移量四个维度作为分析用户行为的基础,从该批数据中提取相关的评价指标。通过聚类算法对用户的分类,分析各类型用户所独有的属性、行为特征。各类用户模型分析结果可以作为电信运营商、服务或应用提供企业根据不同用户类型提供更好的推荐服务。
2 数据集及预处理
2.1 数据集
本研究的数据集来自国内移动电信运营商某市内的一万注册用户的一周数据,时间为2013年12月的第一周。数据包括用户基本信息、通话记录、上网记录、以及使用基站地理位置等,其中共有456006条通话记录网络请求记录。该批数据中的所使用到的具体的信息字段包括: 用户编号(user_id)、移动产品品牌(brand_name)、用户通话产生的费用(call_fee)、用户上网产生的流量费用(gprs_fee)、增值业务费(databusiness_fee)、终端品牌(brand_chn)、手机操作系统(operation_sys)、通话开始时间(start_time)、
您可能关注的文档
- 基于模型的系统工程..docx
- 基于模糊综合评价法的道路施工安全评价..doc
- 基于模糊控制的移动机器人_外文翻译..doc
- 基于模糊规则的PID控制器设计..doc
- 基于汽车空气动力性研究的车体外观及优化改型探究..docx
- 基于波特五力模型的唯品会竞争环境分析..doc
- 基于消费者心理的消费环境设计..doc
- 基于深度学习的专家排序方法..doc
- 基于海水源热泵系统的运行研究..doc
- 基于深度学习的图像识别进展百度的若干实践..docx
- 2025特种作业煤矿安全作业通关题库及完整答案详解【精选题】.docx
- 2025年老龄化社会背景下中国银发健康服务需求分析报告.docx
- 2025-2026学年初中英语鲁教版五四学制2024六年级下册-鲁教版五四学制2024教学设计合集.docx
- 2025特种作业煤矿安全作业通关题库及参考答案详解【综合题】.docx
- 供应链金融ABS在新能源电池行业的应用现状与风险控制策略.docx
- 2025特种作业煤矿安全作业通关题库及参考答案详解【培优】.docx
- 供应链金融ABS在农业产业链的发行策略与风险防范.docx
- 供应链金融ABS在文化旅游融合发展的创新应用与风险防控策略.docx
- 供应链金融ABS在文化创意产业的应用与发展趋势分析.docx
- 供应链金融ABS在物流行业的风险控制与合规性研究.docx
最近下载
- 冠心病合并房颤的抗凝抗栓策略.ppt VIP
- 副高中医护理试题及答案.docx
- 员工职业发展通道设计课程.ppt VIP
- 注册安全工程师中级其他安全生产专业实务(电气安全)模拟试卷3.pdf VIP
- VDI2230高强度螺栓连接的系统计算中文版.pdf VIP
- 汉威KB500可燃气体报警控制器使用说明书.pdf
- 2024-2030全球摩托车和机车头盔行业调研及趋势分析报告.docx
- 2024-2030全球全面式蓝牙摩托车头盔行业调研及趋势分析报告.docx
- 神木市东安煤业有限公司煤炭资源整合项目(0.60Mt_a)(重大变动)环境影响报告书.pdf VIP
- (高清版)DB11∕T 1702-2019 生活饮用水样品采集技术规范.pdf VIP
文档评论(0)