- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
TANET2013臺灣網際網路研討會- 【論文集】
關鍵字為基礎的多主題概念飄移學習
林熙禎 林文羽
國立中央大學資訊管理學系
sjlin@mgt.ncu.edu.tw
100423033@cc.ncu.edu.tw
摘要 2. 文獻探討
隨著網際網路的蓬勃發展,使用者能夠輕易
取 得大量的資訊。然而,在此同時,使用者也得 依照概念飄移的轉換速度與程度, Žliobaitė
面對 資訊過載的問題,如何有效取得當下使用者 於2010的研究,將它分為四種類型 [3] :突發性的
興趣的 資訊是資訊過濾系統主要目的。然而使用 概念飄移 (sudden drift) ,漸進式飄移(gradual
者興趣會 隨著時間轉變,並且包含多種概念,這 drift) ,增量式飄移(incremental drift)與重複性內容
就成為了多 標籤分類下的概念飄移問題;同時文 (reoccurring context) 。目前的研究對於漸進式與增
件也常屬於多 個類別,若僅依照文件的主要概 量式飄移有一定的適應能力,然而在遭遇突發性
念,將之分類,則可能讓使用者錯過潛在感興趣 的概念飄移時,往往因為使用者提供的回饋不
的相關文件。本研究 提出一個以字詞網路為基礎 足,缺乏快速的反應能力。
的使用者模型,透過它 可以依照使用者對於多 概念飄移的問題,目前已經有許多的研究提
個概念的喜好對文件進行 過濾,而在目標概念 出解決方法,依照調整的時間點,可以分為持續
發生變化時,也能夠適當的偵 測並更新模型。 學習的方法 (Evolving learners) 以及以偵測為基礎
的學習方法 (Learners with triggers) 。
關鍵詞 :概念飄移、資訊過濾、使用者模型 在持續學習的方法中,合議分類器 (Ensemble
Classifier)是目前最廣為使用的方法。透過同時訓
1.前言 練多個分類器,再依據分類器的準確性來給予不
同的權重,最終再以投票的方式,來決定其分
資訊過濾系統是以一種以使用者的回饋建構 類,以提升準確性。如 [4] ,這類方法的主要缺點
的使用者模型為基礎,從大量的文字檔案組成的 在於運算成本較高,並且僅僅考慮分類演算法的
資料串流中,過濾掉不相關資訊的自動化資訊系 多樣性(diversity) ,不能保證其分類準確度,如何
統[1] ,例如個人化新聞過濾器,垃圾郵件過濾等 選擇、結合分類器的預測結果將是這類方法是否
等。由於是以使用者模型為基礎,一個有效的模 成功的重要關鍵。
型便成為了資訊過濾系統是否成功的重要關鍵。 而以偵測為基礎的學習方法,則是透過偵測
然而,在現實生活中,使用者的興趣並非一 的機制,來決定是否對學習器或分類器進行調
成不變,對於資訊的需求也會隨著時間而改變。 整。其中最主要的方法為調整視窗法。依照視窗
當使用者的需求改變時,過去使用者所提供的回 內的訓練資料訓練出來的分類器,其分類的準確
饋已
原创力文档


文档评论(0)