大语言荒漠化那顺乌.PDF

中国中文信息学会2014战略研讨会 大数据与语言荒漠化 那 顺 乌 日 贵阳 2014、04、18 图 1 每一项技术革新每一次观念转变 ? 民族语言目前的状况 严峻的形式 ? 我们担心的不只是一个领域,是全局 不是一场春雨,是一场风暴 大数据时代来了 !!! 语言数据的戈壁滩 牧区城镇化带来传统文化的流失 实验:让学生在十分钟内说出十个蒙古语成语 实验2:学生在五分钟内说出几个与畜牧业有关的成语 词汇数量的减少 词汇意义的贫瘠 文化含义的匮乏 语言表现力的减退导致语言 使用度的下降,使语言从日 常生活中逐渐退出。 灭绝!?! • 80年代勉强过了输入输出、电子出版的关; • 90年代勉强过了字符集编码、办公自动化之 关; • 前十年勉强过了网络技术……的关; • 现在又面临大数据之关 民族语言遭到多方面冲击 大数据从资源上冲击民族语言 物联网从技术上冲击民族语言 云计算从观念上冲击民族语言 前几年是“数据稀疏” 现在成了“数据贫瘠” 再过几年“数据枯竭”?? 中文信息处理界是否真正把民文 信息处理视为己任? 民文信息处理是否把自己融入到 中文信息处理中? “目前很多人挂着‘大数据’ 的‘羊头’,卖小数据的 狗肉’” - 有专家调侃 大数据时代羊头还是要挂的 至于卖的肉就不一定是狗的了 新的契机 国家和地方在加民文信息处理方面加大 投入; 观念在改变,社会需求也在加大; 与国家大外交、国家安全联系在一起; 内蒙古自治区政府每年拿出 3000万元专项资金资助蒙古 文信息化; 新的顾虑:低层次重复建设, 短期行为,早产儿,计算机 魔术 希望中文信息处理界继续关 注民文信息处理; 合作、支持大数据开发,合 作空间很大! 已有技术的改造、移植能够 解决民族地区燃眉之急。 学会是否可以考虑组织一次少数民族地 区信息化方面的考察,了解真实的情况, 探索一些合作的切入点; 走出传统思路,通过提交申请,拿到上 亿元,甚至几亿元的大型专项至少近期 不大可能,靠合作最为现实。 国内,国外合作。 2012年5月,内蒙古大学与红山区政府、 赤峰智云公司正式开展合作在蒙东云计算中 心共同建设蒙古文信息服务云平台项目。同 时该平台被列为“内蒙古大学民族语言资源 产业化基地”、“内蒙古大学大学生创业教 育实训基地”。 19 蒙 古 文 信 息 化 云 服 务 平 台 20 邀请 有兴趣的专家到内蒙 古进行考察,认认真 真了解我们的实况, 实实在在提出意见和 建议。

文档评论(0)

1亿VIP精品文档

相关文档