- 36
- 0
- 约小于1千字
- 约 22页
- 2017-04-23 发布于河南
- 举报
CBOW词向量模型
CBOW模型简介及若干源码细节;目录;神经网络语言模型;;Bengio提到的未来工作;CBOW模型;输出层;?;赫夫曼编码:左边记为1,右边记为0
分类:分到左边为负类,右边为正类
被分为正类的概率用下式表示
;对于“足球”这个叶子节点来说,经历了4次二分类;对于词典中的任意词w,赫夫曼树中必定存在一条从根节点到其对应的叶子节点的一条路径,每个节点都有两个分支,可以看成是一个二分类问题,将每一次分类所产生的概率相乘,得到了最终的词w在上下文中的概率。
因此,条件概率p(w|Context(w))的一般公式为
其中
即
;得到的对数似然函数如下
用随机梯度下降法可以得到
;?;CBOW模型更新参数的伪代码;若干源码细节;?;?;词典的存储;低频词和高频词;自适应学习率;参数初始化;
原创力文档

文档评论(0)