微信公众平台开发中的常见问题解析-柳峰.pptVIP

  • 4
  • 0
  • 约2.36千字
  • 约 33页
  • 2017-03-15 发布于上海
  • 举报

微信公众平台开发中的常见问题解析-柳峰.ppt

中文分词 中文分词是指将一个汉字序列切分成一个个单独的词,从而达到计算机可以自动识别的效果。现有的中文分词方法可以分为三类:基于词典的分词方法、基于统计的分词方法和基于规则的分词算法。 下面是对原文“我们都是中华人民共和国的公民”分别采用最少切分法、细粒度切分法得到的分词结果。 倒排索引 通过一个示例来说明什么是倒排索引,假设有两篇文章,内容如下: 对这两篇文章内容进行分词、过滤停用词、统一大小写/时态后得到的倒排索引结构如下: Lucene的评分机制 Lucene的评分机制结合了布尔模型(Boolean Model)和空间向量模型(Vector Space Model,缩写VSM),Lucene首先会通过查询语句中的布尔逻辑(AND,OR和NOT)缩小待评分的文档结果集,再基于VSM对文档结果集进行评分。 Lucene的评分公式如下: 谢谢! * * * * * * * * * * * * * /lyq8479 新浪云计算公开课 演讲:柳峰 微信公众平台开发中的常见问题解析 如何解决 外网服务器 消息处理流程 微信用户 微信服务器 第三方服务器 1、用户向微信公众号发消息 2、通过HTTP POST传递消息 3、接收处理消息 4、返回处理结果 5、通过公众号向用户回复消息 接口配置信息 url, token 我们需要外网服务器 租用云主机 公司服务器 租用VPS 自己架设 SA

文档评论(0)

1亿VIP精品文档

相关文档