- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CRF理论、工具包的使用【荐】.pdf
CRF理论、工具包的使用及在
NE上的应用
廖先桃
2006.4.6
信息检索实验室
信息检索实验室
提纲
CRF理论
CRF工具包的使用
基于CRF 的NE识别
下一步工作
信息检索实验室
信息检索实验室
CRF理论
CRF是Conditional Random Fields 的缩写,即
条件随机域
CRF理论相关PPT 由赵世奇友情赞助☺
信息检索实验室
信息检索实验室
提纲
CRF理论
CRF工具包的使用
基于CRF 的NE识别
下一步工作
信息检索实验室
信息检索实验室
CRF工具包的使用
CRF工具包
/doc/
java 写的CRF工具包,有很详细的说明文档。
FlexCRFs: Flexible Conditional Random Fields
作者:Xuan-Hieu Phan 和Le-Minh Nguyen
C++语言实现
下载地址:http://www.jaist.ac.jp/~hieuxuan/flexcrfs/flexcrfs.html
CRF++: Yet Another CRF toolkit
C++语言实现,有windows下运行的exe程序以及Linux下运行
的版本
下载地址:/~taku/software/CRF++/#features
信息检索实验室
信息检索实验室
CRF++ 的使用(1)
CRF++ 的安装
训练语料的格式
特征模板的格式
训练模型
识别
评测
信息检索实验室
信息检索实验室
CRF++ 的使用(2)
CRF++ 的安装
编译器要求:C++编译器(gcc 3.0或更高)
Linux安装命令(依次执行) :
注意:必须具有root帐号才能安装成功
信息检索实验室
信息检索实验室
CRF++ 的使用(3)
训练语料的格式
训练和测试文件必须包含多个tokens
每个token包含多个列
token 的定义可根据具体的任务,如词、词性等
每个token必须写在一行,且各列之间用空格或
制表格间隔
一个token 的序列可构成一个sentence,sentence
之间用一个空行间隔
信息检索实验室
信息检索实验室
CRF++ 的使用(4)
训练语料的格式这是一个token
每个token包含3列,分别
为词本身、词性和Chunk
标记
这是一个句子
句子间用空行间隔
信息检索实验室
信息检索实验室
CRF++ 的使用(3)
特征模板的格式
模板的基本格式为%x[row,col] ,它用于确定输
入数据中的一个token
其中,row确定与当前的token 的相对行数。col
用于确定绝对列数。
信息检索实验室
信息检索实验室
CRF++ 的使用(3)
特征模板的例子
训练语料 col0 col1 col2
r-2
r-1
r0
原创力文档


文档评论(0)