《竞争情报》2015年起正式出版.pdfVIP

  • 2
  • 0
  • 约3.25千字
  • 约 1页
  • 2017-08-15 发布于湖北
  • 举报
《竞争情报》2015年起正式出版.pdf

2014年 1O月 现 代 情 报 Oct.,2014 第 34卷第 1O期 Joumal0fModem /nformation 、01.34 No.1O 个节点中。任务开始时,每个节点可利用现有数据立即投 稳定,会随着读者自身阅历而发生改变。因此 ,如果离线 入运算。 获取数据并进行预先计算,往往只能基于相似度较为稳定 根据分布式计算的原理,将 12.22MB数据存储在 7个 的图书因素进行运算。如果能及时地获得实时数据 ,那么 节点,理论上分配越平均。整体运算效率越高。即block 就可以采用基于读者的推荐算法实现实时推荐。 size值接近于任务量与节点数的比值 (12.22/7=1.75),同 5 结 论 时Blocksize必须满足是512KB的倍数。因此当以blocksize 为2048000B ( 1.95Sm)时,任务分配较 blocksize为 通过maoop分布式平台和运用 Mahout的 矧uce计 64MB更易趋于均衡。而分配任务、拷贝数据的过程也需要 算框架,可以实现基于大量借阅记录数据的图书推荐服务。 时间,如果blocksize设置过小,也会增加拷贝数据消耗的 在MapReduee运算中增加TaskTmeker节点的数量同时优化 时间。 blocksize参数可以显著提高运算效率和缩短运算时间,是 4.3 充分利用现有设备搭建计算平台的意义 实现个性化荐书服务 自动推送的可行方法。 随着复合型图书馆的兴起和大量普及 ,一些大型图书 参 考 文 献 馆特别是高校图书馆都配备有多媒体阅览室。如何高效利 [1]聂珍 ,王华秋,周建.个性化推荐技术在图书馆服务中的应用 用多媒体阅览室也成为挖掘图书馆资源的重要议题。多媒 [盯.现代情报,2013,33(9):95—102. 体阅览室中的计算机,往往仅用于用户上网浏览查询资料, [2]韩开来,柳炳祥 .关联规则在图书馆新书推荐中的研究 [J]. 其存储功能未被利用。如果通过建立虚拟机的方式将这些 科技信息:学术研究,2007,(34):11—13. 处理器内存及磁盘资源利用起来,对于图书馆资源的高效 [3]奉Iit和,黄家兴.基于Hadoop与Mahout的协 同过滤图书推荐 运用具有实际意义。 研究 [J].图书情报工作,0213,57(18):116—121. [4]马华,王清,韩忠东,等.决策树推荐算法在个性化 图书推荐 4.4 不足与展望 中的应用 [J].软件杂志,0212,33(8):100—104. 本研究中,Hadoop分布式平台的运用尽管很大程度上 [5]陈泽.个性化推荐算法研究及 “大数据”下的系统开发 [D]. 提高了推荐算法的运算处理效率,减少了运算时间。但是 重庆:重庆邮电大学,2o13.5. 就实验结果而言,分钟级以上的耗时可以用于数据的预先 [6]李克潮,黎晓.个性化图书推荐研究 [J】.图书馆学研究:应 处理 ,而对于实时推荐还远远不够。要实现实时推荐,进 用版,2011,(1O):65—69. 一 步提高效率 ,需要更多的研究和尝试。例如通过尝试增 [7]SeanOwen,RobinAnti,TedDI】mjIIg

文档评论(0)

1亿VIP精品文档

相关文档