互联网环境中文深度计算的基本理论与方法 - nlp.zzu.e.pptVIP

  • 1
  • 0
  • 约 39页
  • 2016-10-07 发布于天津
  • 举报

互联网环境中文深度计算的基本理论与方法 - nlp.zzu.e.ppt

互联网环境中文深度计算的基本理论与方法 - nlp.zzu.e.ppt

* * * * * 互联网方言动态地图 * 上海方言中的特征词“好伐”在各地区的分布图 微博用户写作风格阳刚/红粉指数 原创微博 转发微博 男性用户 女性用户 男性用户 女性用户 政府 高跟鞋 赛季 闺蜜 官员 裙子 中国队 星座女 哥们 亲亲 战术 眼线 运营 指甲 球员 kitty 国足 闺蜜 中共 指甲油 NBA 兔子 执政 张小娴 核心 亲爱的 垄断 高跟鞋 互联网 委屈 联赛 睫毛 企业 抓狂 主权 丸子 国内 头发 政权 粉色 中文微博用户在原创微博和转发微博部分偏好词汇Top10统计表 Precision Recall F-Measure 实际性别 0.934 0.949 0.942 男性 0.949 0.933 0.941 女性 性别预测模型在测试数据集上的实验结果 基于Web的古诗词句频度统计 * RANK 诗句 单独频度 覆盖率 累计覆盖率 1 犹抱琵琶半遮面 15840 0.083877 0.083877 2 千呼万唤始出来 12540 0.0664026 0.15028 3 飞入寻常百姓家 7319 0.038756 0.189036 4 每逢佳节倍思亲 7107 0.0376334 0.226669 5 一览众山小 6426 0.0340274 0.260696 6 忽如一夜春风来 5330 0.0282238 0.28892 7 养在

文档评论(0)

1亿VIP精品文档

相关文档