- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于评论相似度推荐使用者歌曲
基於評論相似度推薦使用者歌曲
隊名:怎麼辦呢QAQ
隊員:蘇冠宇 陳奕帆 何依麗
報告大綱
開發目標
後端作業架構
前端作業架構
成果展示
延伸應用
競賽收穫
現有推薦系統
多以歌手本身或歌曲曲風作為推薦依據,
提供的推薦歌曲通常多為同種語言
基於評論相似度
的歌曲推薦
本專案以YouTube作為實驗平台,
並依照歌曲留言的情緒相似度
輔以歌曲音訊特徵來推薦歌曲
專案特色
基於評論相似度
的歌曲推薦
評論包含使用者的主觀感受與想
法 ,若將評論作為比較與後續推
薦的依據,更有機會推薦符合使
用者當下情緒的歌曲,也可推薦
多國語言歌曲。
基於評論相似度
的歌曲推薦
困難點與問題:
2013年還在聽的舉手
大推 !超好聽 1. 罐頭留言
網友的陳年故事 2. 不相吻的情緒留言
他國語言的評論 3. 情緒分析系統的使用語言
核心分析與比較的特徵
1.主要根據情緒相似度進行比較
2.運用字詞內容來評斷跟篩選垃圾留言
• 對所有留言進行斷詞分析
• 建立字詞superset 並計算詞頻強弱
• 利用白/黑名單的方式過濾出想要的留言
3.加入Video跟Audio特徵
後端作業流程大綱
1. 留言情緒分析 IBM Watson
2. 留言字詞superset 建立與詞頻計算 NLTK
3. 過濾想要的留言 白/ 黑名單
4. 依評論與歌曲的特徵維度分群
Spectral Clustering 分群演算
5.增加推薦準確性深度學習模型MLP
後端程式架構
擷取YouTube歌曲評論
式 程 端 後 - YouTube :目前歌曲資料庫最完整、龐大的網站
- 利用YouTube Data v3 API擷取歌曲評論
後端程式架構
情緒分析方式
式 程 端 後 • IBM Watson tone API
- 分析評論情緒成分
- 利用整體比例呈現分析所得的五種情緒組成
(生氣、失望、害怕、悲傷、享受)
- 只能分析英文
• Google Translation API
- 將評論轉為英文 ,以便Watson Tone API
進行評論的情緒分析
後端資料分析遭遇難題
使用elbow-method找最佳分群數目
式 程 端 後 並沒有任何一個分群數目,
可以完美區隔資料
解決方法
嘗試加入多一點特徵
式
文档评论(0)