- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
窗体顶端
东南亚主要华文媒体语料库用字概要 东南亚主要华文媒体汇总总字符数:240920879,字符种数:10031。其中汉字(不含部首、标点和非汉字字符)总次数:181799395,汉字字种 数:8778。新加坡独立新闻在线总字符数字符种数:6152。其中汉字(不含部首、标点和非汉字字符)总次数汉字字种数: 5552。新加坡联合早报总字符数字符种数:8002。其中汉字(不含部首、标点和非汉字字符)总次数汉字字种数: 7004。马来西亚光华日报电子新闻总字符数字符种数:6121。其中汉字(不含部首、标点和非汉字字符)总次数汉字字种数: 5760。马来西亚韩视新闻中心总字符数:9654135,字符种数:6566。其中汉字(不含部首、标点和非汉字字符)总次数:6796399,汉字字种数:6177。马来西亚马新社中文网总字符数字符种数:5331。其中汉字(不含部首、标点和非汉字字符)总次数汉字字种数: 5062。马来西亚亚洲时报总字符数字符种数:5605。其中汉字(不含部首、标点和非汉字字符)总次数汉字字种数: 5372。泰国世界日报总字符数字符种数:5671。其中汉字(不含部首、标点和非汉字字符)总次数汉字字种数: 5401。新加坡新动网总字符数:8083855,字符种数:5024。其中汉字(不含部首、标点和非汉字字符)总次数:6942572,汉字字种数:4828。新加坡亚洲新闻网总字符数字符种数:5851。其中汉字(不含部首、标点和非汉字字符)总次数汉字字种数: 5563。监测语料来自国家语言资源监测与研究中心平面媒体分中心、网络媒体分中心和有声媒体分中心,共4474675个文本文件,3709908405字次,11802个字种。 东南亚主要华文媒体语料库汉字使用分类情况 总字符数:240920879,字符种数:10031。其中汉字(不含部首、标点和非汉字字符)总次数:181799395,汉字字种数:8778。 部首总次数:120358,部首种数:28,所有部首共出现文本数:21014;部首总次数占字符总次数的比率为:0.05%,部首种数占字符字种数的比率为:0.28%。标点总次数标点种数:107;标点总次数占字符总次数的比率为:9.37%,标点种数占字符字种数的比率为:1.07%。 规范字总次数:181696276,规范字字种数:7402;规范字总次数和汉字总次数的比率为:99.94%,规范字字种数和汉字总字种的比率为:84.32%。繁体字总次数:83775,繁体字字种数:929,所有繁体字共出现文档数:24121,繁体字总次数占汉字总次数的比率为:0.05%,繁体字字种数占汉字字种数的比率为:10.58%。异体字总次数:13891,异体字字种数:269,所有异体字共出现文档数:5156,异体字总次数占汉字总次数的比率为:0.01%,异体字字种数占汉字字种数的比率为:3.06%。方言字总次数:355,方言字字种数:22,所有方言字共出现文档数:152,方言字总次数占汉字总次数的比率为:0.00%,方言字字种数占汉字字种数的比率为:0.25%。韩国汉字总次数:2,韩国汉字字种数:1,所有韩国汉字共出现文档数:2,韩国汉字总次数占汉字总次数的比率为:0.00%,韩国汉字字种数占汉字字种数的比率为:0.01%。日本汉字总次数:280,日本汉字字种数:56,所有日本汉字共出现文档数:194,日本汉字总次数占汉字总次数的比率为:0.00%,日本汉字字种数占汉字字种数的比率为:0.64%。旧计量用字总次数:363,旧计量用字字种数:4,所有旧计量用字共出现文档数:241,旧计量用字总次数占汉字总次数的比率为:0.00%,旧计量用字字种数占汉字字种数的比率为:0.05%。不规范简化字总次数:2274,不规范简化字字种数:23,所有不规范简化字共出现文档数:1516,不规范简化字总次数占汉字总次数的比率为:0.00%,不规范简化字字种数占汉字字种数的比率为:0.26%。旧印刷字形总次数:2179,旧印刷字形字种数:72,所有旧印刷字形共出现文档数:640,旧印刷字形总次数占汉字总次数的比率为:0.00%,旧印刷字形字种数占汉字字种数的比率为:0.82%。 东南亚主要华文媒体语料库汉字覆盖率情况 %)
字种数
占所有字种数的比例(
文档评论(0)