- 4
- 0
- 约1.85万字
- 约 7页
- 2019-03-02 发布于未知
- 举报
第31卷第4期 吉林大学学报(信息科学版) V01.31No.4
of
2013年7月 JournalJilin Science 2013
University(InformationEdition) July
文章编号2013)04-0359-06
基于Hadoop的社交网络服务推荐算法
李 玲,任 青,付 园,陈 鹤,梅圣民
(吉林大学通信工程学院,长春130012)
摘要:为高效处理社交网络产生的海量数据,并保证社交网的可扩展性,将TF.IDF(TermFrequency—Inverse
Document
法提取用户微博中的关键词,再根据关键词发现用户的兴趣,并对用户做相应的推荐。为验证分布式TF—IDF算
法的有效性和可扩展性,与TextRank算法的结果做对比。实验结果表明,分布式TF.IDF算法提取的关键词能
更准确地描述用户的特性,同时具有良好的可扩展性。
关键词:Hadoop云平台;分布式TF-IDF算法;MapReduce模型;TextRank算法
中图分类号:TN915 文献标识码:A
forSocialNetworkRecommendationServiceBasedon
Algorithm Hadoop
LILing,RENQing,FUYuan,CHENHe,MEISheng—min
ofCommunication 130012,China)
(College Enslneefing,JilinUniversity,Changchun
orderto amountofdata inthesocialnetworkwith and
Abstract:In
processhuge generated efficiencyscalability,
we thedistributed Document suitablefor
designed TF—IDF(TermFrequency—InverseFrequency)algorithm
this on extractswordsinusers
MapReduce,andimplementedalgorithmHadoop.Thisalgorithmkey weibo,in
this usersinterestcouldbe the servicecouldberecommendedtotheuser.In
way found,andcorresponding
orderto the and ofthedistributedTF—IDF resultsofthedistributedTF-
verifyvalidityscalability algorithm,the
IDF andTextRank was resultsshowthat wordsextracted
algorithm algorithmcompared.Theexperimental key by
thedistributedTF-IDF could characteristicsoftheusermore the
al
您可能关注的文档
最近下载
- 三次握手课件.pptx VIP
- ISO42001-2023人工智能管理体系适用性声明SOA.docx VIP
- ISO_IEC 42001_2023 人工智能管理体系要求培训课件.pptx VIP
- ISO42001-2023人工智能管理体系程序文件.docx VIP
- 量化投资中的耐心资本模型与策略研究.docx VIP
- GB/T 17505-1998 钢及钢产品一般技术标准.pdf
- 2025年新版北师大版小学五年级数学下册全册完整教案.doc VIP
- 中达a600变频器说明书.pdf VIP
- 北师大版五年级数学下册全册完整教案.pdf VIP
- 儿童青少年肥胖治未病干预指南-公示稿.pdf VIP
原创力文档

文档评论(0)