- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算语言学面临华语文教学挑战
改進數位教學網站 在近期科技與網路的激蕩下,我們開始思考自己的針對一詞廣泛閱讀數位教學網站如何改進。 現代漢語語料庫收集的文章一共有5百萬詞、22萬個句子。其他一詞泛讀的語料庫選項是近代漢語、上古漢語、唐詩三百首、宋詞三百首以及英國國家英語語料庫。各類散文漢語語料庫都有斷詞和詞類標記,唐詩與宋詞只有斷詞,沒有詞類標記。英文一詞泛讀提供給學習英語的人參考。 當前網站的設想是學生都能從上下文理解每個詞語的意思,從而得到整個句子的語義。兒童在母語習得過程中不需要通過語義講解,只要經過多次接觸,就能學會。但是成人在短期內要學會一個語言,需要很好的輔導。第二區塊的信息是輔導性質,理想的輔導除了詞類、詞頻之外,應該包括常一起出現的共現詞、詞語搭配、語義和近義詞辨析、語用等等。 “忽然”和“突然”有什麼不同?,如果輔導說明“忽然”可以當副詞,“突然”可以當副詞和形容詞,就能解釋只能說“突然的消費”而不說“忽然的消費”。 英文“on his mind”和“in his mind”有什麼不同?許多學生也許不知道其區別而亂用。在廣泛閱讀中,細心的人會從句子裡看出差異來,如果有這樣的輔導,更能促進理解:“on his mind”是心裡有牽掛或煩惱,“in his mind”說的只是心裡的記憶或思考。相信這樣的輔導對詞語用法的理解有很大的幫助。但是為上萬個詞語仔細編寫輔導是個大工程,不是一兩個教師能夠在短時間內可以勝任的。 大家注意到文字已經分詞,可以幫助學生掌握詞語。不過,學習者在閱讀中就沒有其他協助,如果遇到不懂的詞語,只能靠自己查閱字典或其他資源來瞭解。我們當初希望學生在大量閱讀中自然地認識詞語的語義。成年人,尤其是華語作為外語的人,恐怕很難達到這個理想,需要提供協助才能在泛讀中精讀。 現在的網頁瀏覽科技可以用滑鼠在屏幕上提取文字,對文字加以解釋,這樣的協助可以做到。例如,如果學生不懂“面具”的意思,可以開啟Dr. eye 譯典通7.0 (Inventec Group 2005)的即時翻譯功能,把滑鼠放在“面具”上,就會出現漢語拼音、注音符號和英文解釋。 這裡的翻譯是合適的。不過很多詞語都有好幾個義項,要在上下文中決定合適的語義來呈現卻是個難題。例如“之間”這個詞,譯典通只給出“between; among”的意思,如圖5,那麼“突然之間”就變成“suddenly among”或“among suddenly”,這就不通了。 在這裡“之間”本身的語義界定為時間,“突然之間”就可以理解為急迫的短暫時間。可是這時候原來閱讀“突然”的句子已經不存在,無法繼續閱讀有關的句子。這就造成閱讀的混亂。因此,閱讀中所有詞語的解釋,還需要好好處理呈現的形式、注明語音、研究語境對語義的限定以及如何從近義詞網絡層次變成讀者容易瞭解的語義說明。 網頁介面第二區塊還提供兩個閱讀選項,一是由簡入繁,二是隨機提取。隨機提取就是根據文本的次序開始閱讀,稱為隨機是因為我們整理文本次序時是隨機安排的。由簡入繁是希望照顧初階漢語學生,讓他們從簡單的句子開始,逐漸進入比較繁難的文字。 我們提出漢語句子繁簡考量的因素有三(鄭錦全 2006, 2008),一是句子裡詞語的多寡,詞語少的比詞語多的句子容易閱讀,也就是說短的句子比長的句子簡單。現代漢語語料庫一共有二十二萬個句子,我們根據這個原則排出句子長短,作為由簡入繁的根據。繁簡考量的第二個因素是句中所有詞語在文本中出現的頻率的高低,頻率總和高的比低的句子容易閱讀。表面上這個計算容易做到,但是有些詞語有不同的詞類,例如“一個”,可能是數詞“一”和量詞“個”,也可能是一個副詞如“一個不小心”的“一個”。 句子难易度的分析 句子难易度的分析困难重重,我们提出三个因素来考虑: 句子的长短,也就是句中词语的多少,短句易读; 词语在文本中出现频次的高低,频次高接触多,易懂 ; 句子里词语的语意类别的多少,类别多,复杂性高。 短句易读 妳 以為 我 傻 ? 我 以為 我們 去 唸 其它 學科 不是 從 自己 的 本位 出發 , 而是 開放 自己 , 去 學習 其它 學科 的 思考 方式 , 它們 自己 看待 世界 的 觀點 , 從而 和 我們 自己 的 本行 做 比較 , 這 是 一 種 開放 的 學習 方式 , 套用 電腦界 的 典故 , 開放 架構 比 封閉 架構 更 能 促進 本身 的 發展 , 網路 的 開放 系統 也 逐漸 能 取代 封閉 的 大型 電腦 。 频次高易懂 我(Nh) 的(DE) 爸爸(Na) 是(SHI) 軍人(Na) 。(PERIODCATEGORY) 我(Nh) 的(DE) 爸爸(Na) 是(SHI) 廟祝(Na) 。(PERIODCATEGORY) 军人’的词频是165,‘庙祝’的词频是3,因此‘
文档评论(0)