项目交流会-语文学科本体知识库构建例析.ppt

项目交流会-语文学科本体知识库构建例析.ppt

Semantic Annotation System Architecture Annotation Client Rest API Sesame Triple Store repository MySQL (users, permissions…) Rest API Resource System (books…) Ontology Editor HTTP Annotation Server Rest API? 难点四:自动化语义标注 自动化语义标注目前处于调研阶段,其方法大致有两类: 基于模式的:模式可以是手动定义也可以是挖掘得到的; 基于机器学习的:可以是基于统计模型的,也可以是基于NLP的。 如果数据量特别大的话,可以考虑采用Map-Reduce架构来实现 构建过程的心得体会 心得体会总结 1.构建知识概念体系选用知识点密集、权威性高的教辅书籍,推荐曲一线的知识清单类书籍; 2.构建的知识概念体系和知识点属性采用Excel的形式描述,便于修改,后期可以通过程序生成本体; 3.知识点的属性以及知识概念之间的关系一定要尽可能详细,这样便于后期自动问答系统回答问题; 4.版面标注方案的制定一定要考虑知识是否有用以及如何才能使得后期语义标注更加方便。对于教辅教材类书籍一般是采用语义标注系统进行标注(包括知识点标注和资源标注),但是非教材类书籍一般是采用自动化语义标注,自动化标注的

文档评论(0)

1亿VIP精品文档

相关文档