MALLET教.docVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MALLET教

Mallet:自然语言处理工具包 发表于128 天前??? HYPERLINK /html/ycategory/cat_ico23 \o 查看 技术 的全部文章 技术,? HYPERLINK /html/ycategory/cat_ico37 \o 查看 科研 的全部文章 科研??? HYPERLINK /html/y2010/2199.html \l comments \o Mallet:自然语言处理工具包 上的评论 评论数 6?? 被围观?1006?Views+ HYPERLINK / \t _blank MALLET是基于java的自然语言处理工具箱,包括分档得分类、句类、主题模型、信息抽取等其他机器学习在文本方面的应用,虽然是文本的应用,但是完全可以拿到多媒体方面来,例如机器视觉。 MALLET包含了足够的文本分类的算法,还有特征提取的算法等。文本分类的算法像是Na?ve Bayes, Maximum Entropy, and Decision Trees等,而且也对代码做了优化。 MALLET也包含sequence tagging的工具和算法,例如信息抽取的应用等,算法有Hidden Markov Models, Maximum Entropy Markov Models, and Conditional Random Fields. MALLET也包含主题模型:topic modeling?toolkit contains efficient, sampling-based implementations of Latent Dirichlet Allocation, Pachinko Allocation, and Hierarchical LDA. MALLET当然还有其他功能,很强大。下面是api和一个pdf的链接:[ HYPERLINK /api/ \t _blank API] [ HYPERLINK /mallet-tutorial.pdf \t _blank 教程]。 ==============关于MALLET的安装配置================== HYPERLINK /BILab/lilizhao.html \t _blank 这里有一个安装配置的说明,我把它转载过来了: Mallet?使用说明 ? Mallet是专门用于机器学习方面的软件包,此软件包基于java。通过mallet工具,可以进行自然语言处理,文本分类,主题建模。文本聚类,信息抽取等。下面是从如何配置mallet环境到如何使用mallet进行介绍。 ? 一.实验环境配置 1.???????下载并安装JDK,并正确设置环境变量 需设置三个环境变量: ?????????JAVA_HOME:该环境变量的值就是Java所在的目录, 例如C:\Program Files\Java\jdk1.6.0_10 ?????????PATH:指定一个路径列表,用于搜索可执行文件。 该环境变量值为:%JAVA_HOME%\bin ????????CLASSPATH:指定一个路径列表,是用于搜索Java?编译或者运行时需要用到的类。该环境变量的值为:%JAVA_HOME%\lib\tools.jar;%JAVA_HOME%\lib\dt.jar ????????运行?cmd ?????????分别输入javac和java,没有出错则表示配置成功。 2.???????下载apache-ant,不需安装,只需正确设置环境变量。 apache-ant是一个基于Java的编译工具。 ????????下载? HYPERLINK /bindownload.cgi /bindownload.cgi,解压?放到你要的目录 ????????配置 ??????ANT_HOME:设置为apache-ant的解压目录,例如:C:\server\apache-ant-1.8.0 ?????????????classpath:?%ANT_HOME%\lib ??????Path?:%ANT_HOME%\bin ????????测试 ????????运行?cmd ?????????输入?ant 结果如下则表示配置成功 Buildfile:?build.xml?does not exist! Build failed 3.下载mallet?最新版本mallet-2.0.5,地址: HYPERLINK /download.php /download.php ???????配置环境变量: ?????????MALLET_HOME=MALLET的解压目录,例如C:\mallet ?????????Path中添加?%MALLET_HOME%\bin ?????????classpat

文档评论(0)

ww90055 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档