- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN107038193-CN201611027271-一种文本信息的处理方法和装置
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 107038193 A
(43)申请公布日
2017.08.11
(21)申请号 201611027271.1
(22)申请日 2016.11.17
(71)申请人 阿里巴巴集团控股有限公司
地址 英属开曼群岛大开曼资本大厦一座四
层847号邮箱
(72)发明人 任望
(74)专利代理机构 北京国昊天诚知识产权代理
有限公司 11315
代理人 黄熊
(51)Int.Cl.
G06F 17/30(2006.01)
权利要求书2页 说明书9页 附图3页
(54)发明名称
一种文本信息的处理方法和装置
(57)摘要
本申请公开了一种文本信息的处理方法和
装置,包括:获取文本信息,对所述文本信息进行
过滤;计算过滤后的文本信息的相似度,根据所
述相似度将过滤后的文本信息归类至不同的事
件;根据事件中的文本信息,计算每个事件的重
要度指标;判断每个事件对应的所述重要度指标
数值是否超过预设重要度阈值,如果超过预设重
要度阈值,则对该超过预设重要度阈值的事件进
行标记。通过使用本申请中公开的方法和装置,
能够自动化的将文本信息过滤和归类至不同事
件,并监视各个事件,在某个事件指标超过阈值
时标记该事件,以方便寻找有用信息。
A
3
9
1
8
3
0
7
0
1
N
C
CN 107038193 A 权 利 要 求 书 1/2页
1.一种文本信息的处理方法,其特征在于,该方法包括:
获取文本信息,对所述文本信息进行过滤;
计算过滤后的文本信息的相似度,根据所述相似度将过滤后的文本信息归类至不同的
事件;
根据事件中的文本信息,计算每个事件的重要度指标;
判断每个事件对应的所述重要度指标数值是否超过预设重要度阈值,如果超过预设重
要度阈值,则对该超过预设重要度阈值的事件进行标记。
2.如权利要求1所述的方法,其特征在于,所述对所述文本信息进行过滤,包括以下步
骤中的任一步骤:
使用业务模型判断所述文本信息是否为指定业务,如否,则将判断为否的文本信息过
滤掉;
使用广告模型判断所述文本信息是否为广告,如是,则将判断为是的文本信息过滤掉;
使用情感模型判断所述文本信息负面情感值是否超过预设情感值阈值,如超过,则将
该超过预设情感阈值的文本信息过滤掉,或者,如果不超过,则将该不超过预设情感阈值的
文本信息过滤掉。
3.如权利要求1所述的方法,其特征在于,所述计算过滤后的文本信息的相似度包括:
计算文本信息和文本信息的相似度和/或计算文本信息和事件的相似度。
4.如权利要求3所述的方法,其特征在于,根据所述相似度将过滤后的文本信息归类至
不同的事件,包括:
当过滤后的文本信息和事件的相似度大于预设值时,将该过滤后的文本信息归类至该
事件;当过滤后的文本信息和任意事件的相似度均不大于预设值时,生成包含该过滤后的
文本信息的事件;
或者,
当过滤后的文本信息和另一文本信息的相似度大于预设值时,将该过滤后的文本信息
归类至所述另一文本信息所在的事件;当过滤后的文本信息和任意另一文本信息事件的相
似度均不大于预设值时,生成包含该过滤后的文本信息的事件;
或者,
当过滤后的文本信息和另一文本信息的相似度大于预设值,且该过滤后的文本信息和
所述另一文本信息所在的事件的相似度大于预设值时,将该过滤后的文本信息归类至所述
另一文本信息所在的事件;当过滤后的文本信息和任意事件的相似度均不大于预设值,且
和任
您可能关注的文档
- CN107064045-CN201611138567-一种碳化硅复合材料中氧含量的测定方法.pdf
- CN107063718-CN201710455798-汽车正面碰撞波形参数化评价方法.pdf
- CN107063684-CN201710437164-一种精密减速机构刚性检测设备.pdf
- CN107063657-CN201710121248-一种飞机气动铆接操作合格判定装置和判定方法.pdf
- CN107063647-CN201710312119-滤波片的隔离度与输入光损耗指标的检测装置及方法.pdf
- CN107063644-CN201710416016-有限物距畸变测量方法及系统.pdf
- CN107063424-CN201710299120-基于多元线性回归模型的皮带秤主要误差因素分析的方法.pdf
- CN107063339-CN201710065942-铁道沿线落石与行车信号分类分级判断识别方法.pdf
- CN107063338-CN201710035951-一种药品存储运输环境监测智能模块.pdf
- CN107063058-CN201611148571-一种预制混凝土构件结合面粗糙度的测评方法.pdf
- 2025年全民艾滋病预防传播以及相关知识试题库(附含答案).docx
- 2025年全国特种作业操作证钎焊真题归总及答案.docx
- 2025年全民安全健康饮食知识试题与答案.docx
- 2025年全民国家安全教育及国家安全法应知应会知识考试题库(附含答案.docx
- 营造温馨教室环境实施方案.docx
- 2025年全国特种作业操作证熔化焊接与热切割细选题及答案.docx
- 2025-2026学年小学美术四年级上册赣美版(2024)教学设计合集.docx
- 2025年全民国家安全教育日(415)知识测试竞赛题库(含答案).docx
- 2025年全国特种作业操作证制冷与空调设备运行操作真题练习及答案.docx
- 2025年全国特种作业电工考试题库(附答案).docx
原创力文档


文档评论(0)