- 4
- 0
- 约 21页
- 2017-03-19 发布于天津
- 举报
後設資料線上操作實習及需求規格表填寫
後設資料線上操作實習及需求規格表填寫 張如瑩 ruyng@.tw 中研院語言所籌備處 2002年10月28日 大綱 後設資料線上操作實習 需求調查表 標記目的 標記類別 其他相關計畫或研究 問卷名詞解釋 後設資料線上操作實習 後設資料線上操作實習 以「現代漢語平衡語料庫」為例, .tw/SinicaCorpus/ 現代漢語平衡語料庫 #1 資料來源 報紙:中國時報、自由時報、兒童日報、中央研究院計算中心通訊。 一般雜誌:天下雜誌、光華雜誌、海天遊蹤、世界電影雜誌。 學術期刊:中央研究院民族所集刊、中央研究院生醫簡訊。 教科書:國民小學國語教科書十二冊。 工具書:中研院資訊所詞庫小組的技術報告。 學術論著:論文。 其他:無法歸入其他媒體的檔案。 圖書:洪建全基金會的大眾心理叢書八本、時報出版的巴西狂歡節。 視聽媒體:台灣學術網路裡刊登的文章。 會話訪談:民運人士的訪談紀錄及大陸留美學生日常會話。 XML文件編輯工具 XMLNotepad /library/default.asp?url /library/en-us/dnxml/html/xmlpaddownload.asp 優點: 圖形化介面,層次分明 自動驗證,不用記憶XML句法, 缺點: 中文內容尚不接受 記事本 Notepad , UltraEdit….文書編輯軟體 缺點:需自己記憶句法 以XMLNotepad編輯 以IE瀏覽結果 以文書編輯軟體編輯 詳細結果請見「語言座標及典藏」 .tw/ 需求調查表 標記目的 #1 語言和其他計畫的關係 標記目的 #2 標記的幫助和運用 計算機對自然語言的處理 資訊檢索 機器翻譯 知識管理….etc. 語言學上質和量的研究 質:computational lexicons, grammars, and multi-lingual lexicon and tree bank. 量: frequent or characteristic uses of language, translation equivalents. ? morphological taggers, POS taggers, sense taggers…etc. 內部資料處理與各界資料交換 標記類別 Metadata,類似文件的書目描述 結構 卷、章、節、句、詞彙…. 排版 項目符號的標記… 語言學的注解…etc. 詞類、音韻….. 其他相關計畫 國外 EAGLES/ISLE Meta Data Initiative, http://www.mpi.nl/world/ISLE/ Alaska Native Language Center, /anlc TEI:Text Encoding Initiative, /TEI.html Corpus Encoding Standard, /CES/ 國內 中華佛學研究所CBETA, .tw/cbeta/ 問卷名詞解釋 #1 語音標誌 phonetic 語言的聲音部分. 音素(phoneme): 語音的最小單位. 音節 音綴 syllable : 漢語裡,一個字就是一個音節. 音高(pitch):聲音的高低. 漢語裡音高變化可區分詞義的作用, 如「媽、麻、馬、罵」四個字的聲調不同即音高的不同. 聲調(tone):有些語言,特別是和藏語系各語言裡面不同的音高升降曲折變化具有區分詞義的作用.語言學上稱具有這種音高升降曲折狀態叫做聲調 tone . 吐氣群(breath group) 音調 語調 (intonation): 整個句子的音高曲折變化. 問卷名詞解釋 #2 語法標誌 syntax 也叫「文法」.即語言的組織規律.從最廣的意義上說,語法是只對語言中存在的規則性和不規則性所作的概括描述. 詞類 Parts of Speech :詞的最基本語法分類,例:名詞、動詞… 詞組/短語 phrase, word group : 1 .由兩個或兩個以上的實詞組合而成的句法單位.例:兄弟姊妹,高樓,好得很,愛人民. 2 .在系統語法中,指英語具有五個語法單位之一.詞組包含一個或幾個詞,句包含一個或幾個詞組. 句子 sentence :用來表達一個完整思想的言語單位.一般是由主語和賓語兩個部分所組成. 語法功能 句結構 問卷名詞解釋 #3 語用標誌 pragmatic 語境 亦即實際使用句子時 對於語意解釋的影響,而「語言行為」也是語用研究的一部分. 輪(turn):會話中被提出的單位.有時是由一位對話者所提出,或者由一些對話者所提出的內容. 停頓 pause : 話語中短暫的間歇,常常出現在信息內容或低概率詞組之前. 語調單位(Intonation unit, IU) 問卷名詞解釋 #4 語意標誌 s
原创力文档

文档评论(0)