- 16
- 0
- 约 12页
- 2017-08-31 发布于安徽
- 举报
淺談機器翻譯之瓶頸及目前的研發趨勢
姚念祖 蘇克毅
致遠科技股份有限公司
摘要:機器翻譯是個很吸引人的研究題材,但是卻因為自然語言中的歧義和語法不合設
定問題,而造成研發上的障礙。近年來,由於語料庫資源的快速發展,在機器翻譯系統
的研究領域中,可從雙語語料庫內自動抽取知識的參數式系統,逐漸取代了傳統的規則
庫系統,成為研發的主流。參數式系統不但可以擺脫規則庫系統在研發和效能上的瓶頸,
更可用來進行成本較低的非教導式學習,並針對各專業領域進行領域調適。我們期待結
合語言學的參數式系統,能在未來達成機器翻譯實用化的理想。
(一) 簡介
所謂的機器翻譯 (Machine Translation) ,指的是使用電腦,將以一種原語言 (Source Language) 書寫
的文件,轉換為另外一種目標語 (Target Language) 。自1940年代後期開始 [Hutchins 86] ,機器翻譯
一直是人工智慧領域的重要研發項目。這主要是因為語言向來被認為是人與動物重要的差異所在,因此
能否以電腦進行如翻譯等複雜的語言處理,一直是人工智慧學門中相當引人入勝的課題。而且翻譯本身
即為具有潛力的商業區塊,國際交流的興盛,更擴大了對翻譯
原创力文档

文档评论(0)