电子化知识文件自动分类。-企业运筹与电子化中心.ppt

电子化知识文件自动分类。-企业运筹与电子化中心.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
專利自動分類方法與範例 了解知識分類管理方法及應用 探討運用系統管理電子化文件 討論倒傳遞類神經網路運用在文件分類系統 介紹專利文件自動分類與其方法流程 對企業而言,專利資訊不只是人類的智慧寶庫,也是研究開發人員重要的參考資料。 企業所重視的是如何在茫茫大海中的專利文件,將專利文件轉換為企業所需之有效資訊與情報。 由於專利資訊亦揭露專利侵權的警訊,智財管理人員可藉由專利資訊隨時監控競爭對手的專利核准動向,以降低企業因侵權所付出的龐大智財成本。 7.1 知識文件管理 1/11 近年來企業面臨著更加競爭的環境,而提升企業競爭力的重要因素就是企業內部知識的擷取、儲存以及知識的再利用。 而為了達到此一目的,有三個重要的議題必須解決: 如何有效率的擷取各種知識。 如何對各種不同種類的知識進行管理、分類與儲存。 如何讓使用者迅速取得所需之各種知識,達到知識再利用之目的。 7.1 知識文件管理 2/11 在2000年到2004年的4年時間 ,全球專利註冊申請猛增到50萬件。 發明人最擔心的狀況則是花費許多時間與精力實現自己新的構想後才發現已有相同的發明。 企業在研發初期就應做好專利資訊蒐集的工作,若能事先發現研發的技術是否已被申請專利,亦可提早做迴避設計。 7.1 知識文件管理 3/11 過去工業經濟時代,企業掌握土地、勞力、資本為主,但是面臨全球化市場競爭的企業必須更加注重知識的利用與開發。 如今美國多數大型企業的無形資產總值已經遠超過有形資產,而這種情形在服務業與高科技公司中更加顯著。 在現今歐美各個國家之中,知識管理已經被公認是繼再造工程(Reengineering)之後,企業革新的最佳策略。 知識管理之背景與必要性 電子化文件管理 文件管理是針對企業的各種文件進行管理,其與知識管理最大的差異在於管理的對象,在文件管理中的文件只是企業過去的歷史紀錄。 電子化文件管理相較於傳統文件管理,在文件三大功能方面有以下優勢。 在溝通機制方面,電子化文件擁有更多樣化的媒介,讓各使用者能夠易於了解文件內容。 在商業流程方面,電子化文件管理可與工作流程(Workflow)結合,讓流程控管更有效率。 在組織記憶方面,電子化文件可以儲存更多的文件內容,卻比傳統文件更節省空間。 7.1 知識文件管理 6/11 文件分類(Document categorization)是將文件依據其內容指派至一個或多個「事先定義」好的文件類別的過程。 而文件分群(Document clustering)則是將許多文件依照彼此之間的「相似程度」分為數群。 文件分類是擷取文件特徵並與文件類別之特徵作比較,再依照其相似程度進行分類。 文件分群亦是擷取文件特徵並進行比對,但文件分群並不需要事先定義文件類別,而是依照各文件之間之相似程度進行分群。 文件分類流程 7.1 知識文件管理 8/11 然而一個知識管理系統中,若不針對各種不同的知識文件加以管理分類,則使用者在搜尋相關知識文件時,會耗費相當多的時間。 過去通常是使用人力去進行文件分類,但這樣的做法不僅需要大量人力,也需要大量之時間。 在知識文件分類管理步驟中有文件格式轉換、文件分類規則、文件內容分析以及文件自動分類。 運用資訊科技來協助專利工程師已成為近日趨勢。一個好的文件分類技術,可讓專利工程師以最少的時間,了解最重要的文件。 7.1 知識文件管理 9/11 藉由從不同文集資源中擷取出訊息來發現潛在的、未知的及有用的資訊是文字探勘的主要目的。 Ricardo和Berther認為關鍵字一般以「名詞型態」出現在文件中,因為名詞詞彙通常代表事實之陳述 Lagus等人則認為「優良的關鍵字」必須遵循兩個條件:詞彙於文件群組內顯著重要以及詞彙於文件群組間顯著重要。 關鍵字擷取的技術主要有三種,分別是詞庫比對法、文法剖析法、統計相關法。 辨別複合字的方法 7.1 知識文件管理 11/11 語意網(Semantic web)為全球資訊網的創始人Berners 博士所提出的,主要目的是將網路上的文件有意義的結構化,利用可共享、通用的知識本體。 7.2 文件分類系統 1/5 主要分為兩部分,第一部分是文件內容擷取系統,功能是解析文件之內容以取得各文件的內容相關資訊。第二部分是文件自動分類系統,建構一個能自我學習之分類系統。 系統流程如可分為數個步驟: 上傳電子化知識文件至分類系統。 電子化知識文件內容解析。 電子化知識文件自動分類。 文件檢索與再利用,提供各個不同之使用者查詢各個文件類別與分類完成之文件。 7.2 文件分類系統 2/5 針對文件內容解析之解說各步驟流程: 首先將文件內容作一讀取之動作,將文件字串分解為許多字節。 對於各個不同的字節進行字詞解析,如二字詞、三字詞,或更長之字詞組合等。 統計各字詞出現之頻率,並與系統之門檻值進行比較

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档