新词语流行语-北京大学计算语言学教育部重点试验室
目的是通过语言资源的建设与开发,实现对对大众传媒与基础教育 语言的调查与监测 * 目的是通过语言资源的建设与开发,实现对对大众传媒与基础教育 语言的调查与监测 * 学术委员会对分中心的发展起到重要作用 * 架构体系体现研究、工程、服务 * 随时下达的任务 * 围绕语言资源建设与监测,这些年都开展了相应的研究 * 包括语言形式方面,并尝试对内容的监测 * 字种数方面,似乎有逐年增多,仅从表中看,2009年度的字种数是最多的,一方面与该年度《通用规范汉字表》在社会公开征求意见、汉字繁简讨论等内容有关;另一方面,与网络上标新立异地使用汉字的现象增加有关,媒体对这种现象的关注、评论也使得一些生僻字出现。同时,越来越多的对中国传统文化的介绍、传播与研究,对汉字的使用也有一定的影响。 * * 穷尽式搜索 将一年的媒体语料,提取全部2至9字串,计算出每一个字串在每一个月中的使用率。过滤达不到“广为传播”的使用率较低的字串。 曲线拟合 对于由第一步获得的所有字串,以每一个月的使用率为参数,检验其在一年内使用频率的变化是否符合上述流行语的曲线特征。 人工筛选 进入流行语候选集中的字串,有些是不成词语的,如“和谐社”,它仅仅是“和谐社会”的一部分,因此要对针对这些内容制定一些规则,根据规则筛选掉不可能成为流行语的候选字串,然后再根据字串表达的完整性、区别性、以及词语对所表达内容的贴切性,语感等因素,
原创力文档

文档评论(0)