sparkcrf:一种基于spark的并行crfs算法实现 sparkcrfa parallel implementation of crfs algorithm with spark.pdfVIP
- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
sparkcrf:一种基于spark的并行crfs算法实现 sparkcrfa parallel implementation of crfs algorithm with spark
DOI:10 .7544/issn1000‐1239 .2016
Journalof Computer Research andDevelopment 53(8):1819 1828 ,2016
:
1 ,2 2 2 1 2 2
1 ( 110819)
2 ( 100190 )
(zhujzh. aper@ mail.com)
p g
:
1 ,2 2 2 1 2 2
ZhuJizhao ,Jia Yantao ,XuJun ,Qiao Jianzhong ,Wang Yuanzhuo ,and Cheng Xueqi
1 ( , , 110819)
2 ( , ,
, 100190)
Condition random fields has been successfully applied to various applications in text
analysis, such as sequence labeling , Chinese words segmentation, named entity recognition, and
relation extractionin naturelanguage processing .The traditional CRFs toolsin single‐nodecomputer
meet many challenges when dealing with large‐scale texts. For one thing , the personal computer
experiences theperformancebottleneck;Foranother,theserverfailsto tackletheanalysisefficiently .
And upgrading hardware of the server to promote the capability of computing is not always feasible
due to thecost constrains.To tackle theseproblems,inlight of theideaof “divideandconquer” ,we
design andimplement SparkCRF,whichisakindof distributedCRFsrunning oncluster environment
basedon ApacheSpark.We perform three experiments using NLPCC2015 and the 2nd International
ChineseWordSegmentationBakeoff datasets,to evaluateSparkCRFfrom theaspectsof performance,
scalability and accuracy . Results show that: 1 )compared with CRF+ + , SparkCRF runs almost
4 times faster on our cluster in sequence labeling task; 2
您可能关注的文档
- gps软件接收机相关器的设计 design of a new correlator applied to gps software receiver.pdf
- gps定时多道分析仪的研究与实现 research and implementation of gps timing multi-channel analyzer.pdf
- gf(2m)上椭圆曲线密码协处理器的快速实现 fast implementation of elliptic curve cryptography coprocessor over finite field gf(2m).pdf
- gps数据在公交节点影响范围分析中的应用 applications of gps to define zone affected by transit node.pdf
- gsm长短信pdu编码分析 gsm long-sms pdu coding analyses.pdf
- h.264到avs快速视频转码技术研究 research on video transcoding from h.264 to avs.pdf
- h.264avc全零块检测算法原理及性能分析 analysis of principle and performance about azb detection algorithm for h.264avc.pdf
- go法在软件体系结构可靠性分析中的应用 application of the go methodology in reliability analysis of software architecture.pdf
- hcsim一种长期高频block-level快照索引技术 hcsim an indexing method for long-lived frequent block-level snapshot.pdf
- hadoop mapreduce短作业执行性能优化 performance optimization for short job execution in hadoop mapreduce.pdf
- 2025年度中国井冈山干部学院面向全国引进优秀人才(5人)模拟试卷附答案详解(典型题).docx
- 2025年广西东兴国家重点开发开放试验区管理委员会招聘东兴产业园笔试备考试题附答案详解(培优b卷).docx
- 2025年度中国人民警察大学第二批招聘(60人)模拟试卷及1套完整答案详解.docx
- 2025年广西河池罗城特聘农机技术指导员的(1人)模拟试卷含答案详解(典型题).docx
- 2025年度中央机关及其直属机构补充录用公务员(2577人)考前自测高频考点模拟试题及参考答案详解一.docx
- 2025年天津市面向甘南籍未就业高校毕业生招聘事业单位工作人员公考前自测高频考点模拟试题及答案详解一.docx
- 2025年天津市公安局和平分局关于面向社会招聘警务辅助人员(笔试备考试题及一套完整答案详解.docx
- 2025年广东省梅州市蕉岭县专场招聘紧缺学科教师(8人)考前自测高频考点模拟试题附答案详解(培优).docx
- 2025年富裕县12345综合指挥中心招聘公益性岗位人员(1人)模拟试卷参考答案详解.docx
- 2025年度中国文化遗产研究院应届毕业生招聘(6人)笔试备考试题附答案详解(基础题).docx
文档评论(0)