基于Spark的电商网站用户行为分析预测系统研究.pdfVIP

  • 4
  • 0
  • 约1.59万字
  • 约 5页
  • 2025-09-01 发布于江西
  • 举报

基于Spark的电商网站用户行为分析预测系统研究.pdf

第18卷第1期贵阳学院学报(自然科学版)(季刊)Vol.18No.1

2023年3月JOURNALOFGUIYANGUNIVERSITYNaturalSciences(Quarterly)Mar.2023

基于Spark的电商网站用户行为分析预测系统研究

谢鑫

(漳州职业技术学院,福建漳州363000)

摘要:以Spark软件为工具,对电商网站用户行为分析预测系统进行探讨,在此基础上,对一家电商平台

进行了一系列的预处理,包括在一定的时间段内,对用户的行为进行处理,提出时间序列规则处理原始数据

动态滑动窗口。用户行为分析实验表明,XGBoost的训练模式表现最好,而决策树的学习效果最差。XGBoost

模型无需对全部的训练进行集合,是通过XGBoost在每一个滑行窗口内使用XGBoost来输出最后的预测。XG-

Boost在预测结果正确率、稳定性方面均较好。Spark平台主要由数据读入、RDD的创建、用户行为预测计算

三部分构。相比Hadoop平台,基于Spark平台系统效率提高了近8倍,系统运行速度降低幅度较大,减少了

电商网站运营成本,Spark平台系统可靠性较高。

关键词:Spark软件;用户行为分析;预测;电商网站;XGboost模型

中图分类号:TP393文献标识码:A文章编号:1673-6125(2023)01-0009-05

ResearchonSparkbasedE-commerceWebsite

UserBehaviorAnalysisandPredictionSystem

XIEXin

(ZhangzhouVocationalandTechnicalCollege,Zhangzhou363000,Fujian,China)

Abstract:BasedonSparksoftware,thispaperstudiestheuserbehavioranalysisandpredictionsystemofe-commerce

websites,andonthisbasis,aseriesofpre-processingiscarriedoutonane-commerceplatform,includingprocessing

userbehaviorwithinacertainperiodoftime,andproposingtimeseriesrulestoprocessthedynamicslidingwindowof

rawdata.UserbehavioranalysisexperimentsshowthatXGBooststrainingmodeperformsthebest,whiledecisiontrees

havetheworstlearningeffect.TheXGBoostmodeldoesnotneedtosetallthetraining,andusesXGBoostineachgli-

dingwindowtooutputthefinalprediction.XGBoosthasgoodaccuracyandstabilityinpredictionresults.TheSpark

platformismainlycomposedofthreeparts:datareading,RDDcreation,anduserbehaviorpredictionandcalculation.

ComparedwithHadoopplatform,thesystemefficienc

文档评论(0)

1亿VIP精品文档

相关文档