社会科学研究中的文字探勘应用以文意为基础的文件-中国文化大学.pdfVIP

  • 7
  • 0
  • 约6.45万字
  • 约 36页
  • 2018-04-06 发布于天津
  • 举报

社会科学研究中的文字探勘应用以文意为基础的文件-中国文化大学.pdf

社会科学研究中的文字探勘应用以文意为基础的文件-中国文化大学

《人文及社會科學集刊》 104/ 12 , pp. 683– 718 第二十七卷第四期 ( ) C 社會科學研究中的文字探勘應用 :以文意為基礎的文件分類及其問題 683 ○中央研究院人文社會科學研究中心 * 陳世榮 中國文化大學行政管理學系副教授 隨著電子典藏技術的精進 ,文字探勘技術逐漸受到重視 ,本文以社會科學 研究在文意區別上的需求 ,評估監督式機器學習對非結構 、複雜文本的分類效 果 ,並就所見問題提出分析與建議 。本文從文字探勘與內容分析文意區別上的 差異與共通性出發 ,繼而以新聞報導為分析資料 ,針就特定文件意向,遵循一 般文字探勘程序 ,以支持向量機與簡易貝式分類器執行文件分類評估 。分析結 果指出,文字探勘對於複雜文意的判讀效果值得肯定 ,但經由共詞網絡分析也 發現 ,文件的編撰風格將影響文件分類的效果。建議研究者在資料處理初期 , 應反覆評估研究目的、資料特性與分類器模型間的契合度 。

文档评论(0)

1亿VIP精品文档

相关文档