文本挖掘接口文档.pdf

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文本挖掘接口文档

文本挖掘接口文档 概述 达观数据科技为应用方提供了功能强大、使用灵活的文本挖掘服务,通过简单易用的HTTP接口,帮助 应用方有效分析大量的文本数据,提高应用方的处理效率。 达观文本挖掘系统提供四种文本挖掘服务: 1. 文章自动标签提取:从文本数据中自动提取出较为重要的关键词标签。 2. 文章自动归类:自动判别文章所属类别,并给出相应的置信度,比如判断一篇文章是属于娱乐八卦、 时事政治还是数码科技等。 3. 文章自动审核:自动判别文章内容是否政治违规或者是否情色违规,同时给出违规的严重程度。 4. 垃圾评论自动过滤:自动判断用户评论数据是否为垃圾评论,并给出置信度。 注意事项 您需要完成以下步骤后,才可调用达观数据相关服务。 1. 如您还没有开通达观账号,请先开通,账号开通请参考文档:Step 1:开通账号 (/quick­start/step1)。 2. 获取您的appid 及appname ,请参考文档:获取AppId及AppName (/quick­start/step1#获取AppId、AppName)。 3. 设置IP白名单,请参考文档:设置IP白名单 (/quick­start/step1#设置IP白名 单)。 数据统计和结果反馈 数据统计和结果反馈目前仅限于文章自动归类、文章自动审核和垃圾评论自动过滤三种服务中。 在上述操作正确执行,服务运行正常情况下,可以登录到系统后台查看统计数据。 同时,用户可在系统后台查看到并且进行结果反馈操作。 结果反馈请点击右侧的操作按钮。反馈结果会上传系统用于模型训练和效果提升。 如需将反馈结果实时响应给应用方,可以添加回调地址。回调地址是应用方提供的,接受消息推送的地 址。添加回调地址之后,一旦用户在系统平台提交结果反馈,反馈结果会通过POST方式的HTTP请求, 推送到用户填的回调地址,用户可以根据推送内容去进行相关处理。反馈结果格式见各服务模块。 接口列表 文章自动标签提取 URL /tagging/YOUR_APP_NAME Http Method POST Http 返回格式 JSON Http 请求参数说明 参数 类型 是否必需 描述 appid int 是 应用的id text string 是 要提标签的文本数据 title string 否 要提标签的文本标题 textid string 否 标记该文本的唯一ID Http 返回结果说明 字段 类型 描述 status string 执行结果,OK为成功,FAIL为失败,WARN为有部分非重要字段异常,请 根据返回错误信息进行排查。 tag_list string 提标签结果,为一个列表的json字符串,列表每一项是一个文本标签和权 重,权重取值范围是0~1000 request_id string 该条上报记录的序号,仅用于排查问题使用 errors string 错误信息 示例 CURL调用示例: curl -i -X POST -d appid12345textAlphaGo首战胜李世石,科学家:机器人超 过人类很正常title围棋比赛textihttp://taggingapi.datagr /tagging/meituan   成功返回示例: {     status: OK,     tag_list: [{         tag: 围棋比赛,         weight: 1000     }, {         tag: alphago,         weight: 233     }, {         tag: 李世石,         weight: 156     }, {         tag: 机器人,         weight: 145     }, {         tag: 科学家,         weight: 113     }, {         tag: 人类,         weight: 103

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档