- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
以部落格文本进行情绪分類之研究
以部落格文本進行情緒分類之研究
楊昌樺 陳信希
國立台灣大學資訊工程學系
chyang@.tw; hhchen@.tw
摘要
本文從部落格文本中帶有情緒符號的文句出發,探討人們的溝通行為擴展至網路
空間後,如何將情緒表達的需求反映在文字與情緒符號的使用上,並進一步以情緒符
號的意涵作為文句表達情緒的分類依據。我們從雅虎奇摩部落格服務取得訓練與測試
集,以向量支撐機(SVM)運用文句特徵設計情緒分類器,並藉由各項情緒分類器的實
驗數據,研究是否可以利用情緒詞彙解釋人們在部落格中使用情緒符號的偏好與特
徵,進而達成對網路空間人們情緒的解讀與分析。
1. 緒論
達爾文於 1872 年發表“The Expression of the Emotions in Man and Animals”一書,他以
進化的觀點分析動物和人類在情緒質量上相似與相異之處。之後一百多年來,心理學、腦
神經科學、認知科學等領域的學者也投入人類情緒分析的研究,並發展出透過腦部影像、
心跳、血壓等生物訊號來判斷人類情緒變化的方法(Dolan, 2002) 。情緒狀態的傳遞亦屬於
人類溝通行為的一個重點成份,人類可以透過臉部表情、肢體動作、手勢、語言、聲調等
訊息來表達自己的情緒狀態,溝通的對象也會根據自身的經驗、以及對表達者的理解來解
讀對方的情緒。
情緒解讀的工作也吸引電腦科學領域學者的注意,隨著電腦辨識技術的演進,人類表
達出的各項訊息轉換成數位資訊,研究人員採用機器學習等方式,計算這些資訊與各項情
緒類別的關係。相關的研究包括:當判斷的類別定義成人類的情緒狀態後,如何挑選適當
的資訊作為特徵,以訓練出相關模型來判斷人類的情緒。如 Chuang and Wu (2004)使用文
字及語音兩類特徵資訊對語音句子所隱含的情緒進行辨識,研究結果顯示同時使用兩類特
徵,比單獨使用一類特徵對情緒辨識有更好的效果。 Pao 等人 (2005)也使用語音特徵建立
情緒分類器,開發的工具可協助聽障人士透過語音進行情緒的表達。
近代電腦科學界所興起的一項重大發明-網際網路,除了提供電子資訊分享的平台
外,也提供人們不同於以往的溝通介面。追溯自網際網路開始用來傳遞資訊 (如電子郵件、
電子佈告欄、電子聊天 的年代,透過網際網路傳遞文字,可以在即時即地的基礎上,達)
成使用者互動溝通的便利性。然而當通訊的對象越來越習慣這項新的通訊方式後,也開始
產生了需傳遞彼此情緒狀態的需求。通常在網際網路上傳遞訊息時,會缺乏夠多的前後文
資訊來判斷對方的情緒狀態,為了避免因此造成溝通時的誤解, 1981年CMU的 Scott
Fahlmany曾經設計「 :-)」和「:-( 」兩個可以放在文字中的符號,以象徵性的笑臉和哭臉來
代表高興或不愉快的情緒。隨著類似象徵情緒或表情的符號不斷地被網際網路使用者創造
與使用,甚至到了90年代unicode要擴充全球通用文字碼時,情緒符號也佔了一席之地,如
unicode集合中三個字元「☹」、「☺」、「☻」的十六進位碼分別定為 0x2639 、0x263a 、0x263b 。
近年來,因為圖形使用介面的演進,讓更多表情文字得以圖示化的方式呈現,所產生
的新興圖示集合通稱為 Smiley或 Emoticon ,這些圖示被大量使用在以網際網路為主的通訊
媒介中。而個人化訊息傳遞服務的流行更加速了這種圖示流行的趨勢,如雅虎即時通、微
軟 MSN Messenger 等傳訊軟體,皆提供使用者可在傳訊的介面上使用許多不同情緒符號或
是自訂圖示。此類圖形對應到一些表情文字或是自訂的字元順序,讓個人偏好的圖示與動
畫得以即時內嵌在通訊的內文中間。 Liu 等人 (2003)曾以文字與生活常識建立模型來判斷
人的情緒,並設計出一個電子郵件介面EmpathyBuddy ,根據郵件中每一句話賦予一個
Chernoff Faces ,這些臉部表情也增進了使用者訊息互動的趣味性。
除了表情與情緒符號的使用外,網際網路使用者也會在既有語言範疇之外,創造新的
文字表達規則。所創造的新詞彙或用語,形成網路方言的一部分。這些方言通常出現在以
網際網路為主的電子媒介所使用的溝通訊息中,夾雜於正常的語言文句之內。這樣的呈現
通常會讓原
文档评论(0)