- 28
- 0
- 约3.04千字
- 约 29页
- 2018-09-02 发布于天津
- 举报
TFIDF观念于自动摘要实作-Read
TFIDF方法之介紹 指導教授:王宗一 老師 報告者:林群貿 Outline 1.前言 2.TFIDF演算法介紹 3. 應用TFIDF 觀念於自動摘要實作評估 4.結論 前言 詞頻(Term Frequency, TF)的觀念起源於(Luhn,1958) 從進行自動索引的實驗中,為統計詞彙的出現頻率,發現除卻高頻與低頻者,所留下的中頻(middle-frequency)字詞,多半是比較有意義的,因而提出「關鍵字詞適度詞頻論」(resolving power of significant words)。 前言 而後引發日後諸多學者如:Sparck Jones(1972), Salton McGill (1983)等人投入自動文件處理的興趣。 一般自動索引的主題分析主要可以歸納成三種不同的方式: 1.語意(semantic) 2.語法(syntactic) 3.統計(statistical) 統計學派可以說是三種方式中的主流,多數的自動摘要與自動分類也遵循Sparck Jones與Salton所建構,以文件詞彙頻率為主的統計學派。 其中TFIDF方法就是計算文件詞彙頻率,常用的方法。 Term frequency and Document Frequency Term frequency tfij: the numb
您可能关注的文档
- 1511同底数幂的乘法-湘一芙蓉中学.PPT
- 2006民事执行保全法ofcivilpro-关西大学.PPT
- 2007教学创意体验工作坊.DOC
- 2008年高考地理试题及答案海南卷.DOC
- 2008甘肃高等学校精品课程申报表本科推荐单位兰州.DOC
- 2009国家精品课程申报表本科-西安电子科技大学经济与管理.DOC
- 2008年高考文科综合宁夏地理部分.DOC
- 2011学年高一化学单元检测.DOC
- 2011届会计学专业毕业论文相关材料一览表-武昌理工学院商学院.DOC
- 2011年科技攻关专项申报.DOC
- UltraECL底物化学发光检测试剂盒-深圳中联生物科技开发.DOC
- WA4320X支持IEEE80211ac2条流866Mbps具备IP67防水防尘.PPT
- U1第一课时-广州小学英语教研.PPT
- XDWZCG2018-A-024厦门大学化学化工学院多功能微孔读板机.DOC
- TX1808-英国耐火电缆标准BS6387在火灾情况下保持电路完好的电缆.DOC
- XDTP2018-A-035厦门大学医学院通风-厦门大学资产处.DOC
- 一企业年金账户信息查询2008419开通-建设银行.DOC
- 一个控制系统中可能同时存在若干个干扰因素.PPT
- 一共有只小朋友们你们真聪明!.PPT
- 一线性表的顺序存储结构-Read.DOC
原创力文档

文档评论(0)