- 0
- 0
- 约1.71万字
- 约 14页
- 2023-05-14 发布于四川
- 举报
本发明实施例提供一种基于双语平行语料生成LDA主题模型的方法及装置,所述方法包括:对第一语言文档库和与第一语言文档库平行对应的第二语言文档库分别进行LDA主题建模,获得第一语言主题模型和第二语言主题模型;对第一语言主题模型和第二语言主题模型进行词语对齐,获得词语对齐关系;基于所述词语对齐关系,对第一语言主题模型和第二语言主题模型进行主题对齐,获得所有对齐的第一语言主题和第二语言主题;对于所有对齐的第一语言主题和第二语言主题下的若干组对齐的词语,调整每组对齐的词语隶属于各自语言主题的概率值,并对所
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 111125350 A
(43)申请公布日
2020.05.08
(21)申请号 20191
原创力文档

文档评论(0)