结合内文、时间、社交关系的部落格使用者分群技术研究背景近年来部落.docVIP

  • 2
  • 0
  • 约7.1千字
  • 约 5页
  • 2019-04-08 发布于天津
  • 举报

结合内文、时间、社交关系的部落格使用者分群技术研究背景近年来部落.doc

结合内文、时间、社交关系的部落格使用者分群技术研究背景近年来部落.doc

結合內文、時間、社交關係的部落格使用者分群技術 研究背景 近年來部落格(blog)的使用人數越來越多,人們可以在個人的部落格上發表文章(或稱為網誌)。一個部落格的使用者(blogger)可能會擁有數十篇的網誌。內容可能是對事物的看法或評論、商品的使用心得、感興趣的主題甚至是生活上的種種小事…等。使用者從原本單方向接受網際網路上的資訊,變成可以提供資訊的角色。而如何分析每天都在增加的大量部落格資料,提供給推薦系統(recommender systems)、事件偵測(event detection)、廣告行銷(targeted advertising)…等運用,就變成一個非常重要的問題。為了能夠正確的分析部落格資料,我們提出一個結合內文、時間、社交關係的距離計算方法,並且在研究的最後,基於這樣的距離計算方式,量身訂做一個分群方法用以增加分群的效能。 研究目的 在部落格資料的分析中,將部落格的使用者正確的分群,可以提供給後端的各種運用並且提升其效能。要能夠達到較正確的分群結果,一開始使用者之間距離的計算就變得非常的重要了。 在目前的研究中,對於部落格使用者之間距離或是相似度的計算,主要是利用使用者本身網誌的內文(content)來進行相似度的計算。即是用使用者所發表的文章來代表使用者本身。方法上主要有兩種觀點,一種觀點是將使用者看成一篇非常大的文章,其中文章的內容就是使用者本身所有的網

文档评论(0)

1亿VIP精品文档

相关文档