- 4
- 0
- 约1.59万字
- 约 5页
- 2025-09-01 发布于江西
- 举报
第18卷第1期贵阳学院学报(自然科学版)(季刊)Vol.18No.1
2023年3月JOURNALOFGUIYANGUNIVERSITYNaturalSciences(Quarterly)Mar.2023
基于Spark的电商网站用户行为分析预测系统研究
谢鑫
(漳州职业技术学院,福建漳州363000)
摘要:以Spark软件为工具,对电商网站用户行为分析预测系统进行探讨,在此基础上,对一家电商平台
进行了一系列的预处理,包括在一定的时间段内,对用户的行为进行处理,提出时间序列规则处理原始数据
动态滑动窗口。用户行为分析实验表明,XGBoost的训练模式表现最好,而决策树的学习效果最差。XGBoost
模型无需对全部的训练进行集合,是通过XGBoost在每一个滑行窗口内使用XGBoost来输出最后的预测。XG-
Boost在预测结果正确率、稳定性方面均较好。Spark平台主要由数据读入、RDD的创建、用户行为预测计算
三部分构。相比Hadoop平台,基于Spark平台系统效率提高了近8倍,系统运行速度降低幅度较大,减少了
电商网站运营成本,Spark平台系统可靠性较高。
关键词:Spark软件;用户行为分析;预测;电商网站;XGboost模型
中图分类号:TP393文献标识码:A文章编号:1673-6125(2023)01-0009-05
ResearchonSparkbasedE-commerceWebsite
UserBehaviorAnalysisandPredictionSystem
XIEXin
(ZhangzhouVocationalandTechnicalCollege,Zhangzhou363000,Fujian,China)
Abstract:BasedonSparksoftware,thispaperstudiestheuserbehavioranalysisandpredictionsystemofe-commerce
websites,andonthisbasis,aseriesofpre-processingiscarriedoutonane-commerceplatform,includingprocessing
userbehaviorwithinacertainperiodoftime,andproposingtimeseriesrulestoprocessthedynamicslidingwindowof
rawdata.UserbehavioranalysisexperimentsshowthatXGBooststrainingmodeperformsthebest,whiledecisiontrees
havetheworstlearningeffect.TheXGBoostmodeldoesnotneedtosetallthetraining,andusesXGBoostineachgli-
dingwindowtooutputthefinalprediction.XGBoosthasgoodaccuracyandstabilityinpredictionresults.TheSpark
platformismainlycomposedofthreeparts:datareading,RDDcreation,anduserbehaviorpredictionandcalculation.
ComparedwithHadoopplatform,thesystemefficienc
原创力文档

文档评论(0)