- 179
- 0
- 约 5页
- 2016-10-17 发布于重庆
- 举报
php实现自动获取生成关键词功能
php实现自动获取生成关键词功能
以前写程序一直在逃避这个问题,tag什么的都是要求使用程序的人自行输入,对于某些懒人及为了程序的体验,则是希望可以有自动生成文章关键词,自动获取文章tag的类似功能,这次为了迎接新的项目,所以捣鼓了一晚上,研究了一下这个功能。要实现自动获取关键词的功能,大概可以分成三步 1,通过分词算法将标题和内容分别进行分割,提取出关键词和频度。当前主要的两个算法是中科院的ICTCLAS和隐马尔可夫模型。但这两个都太高端,有一定的门槛,且都是只支持C++/JAVA。基于PHP的当前有两个是值得推荐的PSCWS和HTTPCWS。 SCWS于2008-03-08发布1.0.0 正式版,到现在最新版本已经到了1.0.4。PSCWS是它的PHP版。而HTTPCWS是张宴开发的,之前叫PHPCWS。PHPCWS 先使用“ICTCLAS 3.0 共享版中文分词算法”的API进行初次分词处理,再使用自行编写的“逆向最大匹配算法”对分词和进行词语合并处理,并增加标点符号过滤功能,得出分词结果。不过很遗憾目前仅支持Linux系统,尚未移植到win平台上。2,将提取结果与现有词库进行比较,处理,去除无用的词得到最符合规则的关键词。这里主要就是要看词库了,我们可以自己定义词库,也可以使用现有的成熟词库。比如新浪和网易博客都有这个功能,。他们分词应该有不错的词库,因为他们都是大网
您可能关注的文档
- 经肩峰外侧小切口治疗肱骨近端骨折的相关解剖学研究 许文胜,周君琳.doc
- 经费核销及帐务处理 .doc
- 经费核销应行注意事项 .doc
- Photoshop给偏暗的海景人物加上甜美的淡蓝色.docx
- 经费核销注意事项.doc
- Photoshop给风景照加烟雾弥漫特效.doc
- Photoshop自带滤镜概念全解(PS基础详解).doc
- Photoshop绘制逼真头发发丝效果.docx
- 经适房协议书(校内有房) .doc
- Photoshop调出海景人物图片柔美的淡绿色.doc
- 地方国有企业行政管理绩效评估指标体系构建:温州建设集团的探索与实践.docx
- 基于多维度分析的药用白芍优良种质资源筛选与评价研究.docx
- 文化语境动态顺应视角下《浮生六记》两英译本对比研究.docx
- 颈椎病的诊断和康复疗法.pptx
- 河内市丹凤县VNPT电信企业客户服务管理:现状、挑战与优化策略.docx
- 基于计算机预测的热处理零件组织性能调控与结构优化设计研究.docx
- 半导体微腔激光器与光放大器:原理、研制及应用的深度剖析.docx
- 华北地区高尔夫球场草坪养护策略与质量评价体系构建.docx
- 考试应对技巧主题班会PPT课件.pptx
- 电信运营商电子渠道互联网化的深度剖析与策略转型.docx
原创力文档

文档评论(0)