TopicStructureIdentificationofPClauseSequenceBasedon.pptVIP

TopicStructureIdentificationofPClauseSequenceBasedon.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
TopicStructureIdentificationofPClauseSequenceBasedon

CTCs Scoring Function CTC Tree Extend to other text * * * * * * Yuru Jiang , Rou Song Beijing University of Technology Example:斑鳐 c1: 斑鳐 是 鳐形目 鳐科 鳐属 的 1 种 。 c2: 吻 中长 , c3: 尖 突 。 c4: 尾 细长 , 斑鳐 是 鳐形目 鳐科 鳐属 的 1 种 。吻 中长 ,尖 突 。尾 细长 , PClause Sequence c1: 斑鳐 是 鳐形目 鳐科 鳐属 的 1 种 。 c2: 吻 中长 , c3: 尖 突 。 c4: 尾 细长 , t1:斑鳐 是 鳐形目 鳐科 鳐属 的 1 种 。 t2:斑鳐 吻 中长 , t3:斑鳐 吻 尖 突 。 t4:斑鳐 尾 细长 , What we have done Identification Process Identification Algorithm CTCs Scoring Function Example2:斑鳐(选自《中国大百科全书》) c1: 斑鳐 是 鳐形目 鳐科 鳐属 的 1 种 。 c2: 吻 中长 , c3: 尖 突 。 c4: 尾 细长 , t1= c1 t2=? if: t1: 斑鳐 是 鳐形目 鳐科 鳐属 的 1 种 。 c2: 吻 中长 , then: t2=? 吻 中长 , 斑鳐 吻 中长 , 斑鳐 是 吻 中长 , 斑鳐 是 鳐形目 吻 中长 , 斑鳐 是 鳐形目 鳐科 的 吻 中长 , 斑鳐 是 鳐形目 鳐科 鳐属 吻 中长 , 斑鳐 是 鳐形目 鳐科 鳐属 的 吻 中长 , 斑鳐 是 鳐形目 鳐科 鳐属 的 1 吻 中长 , 斑鳐 是 鳐形目 鳐科 鳐属 的 1 种 吻 中长 , c2的CTCs t1 CTCs of c2 Topic Clause of C3 C3 if: CTCs of c2: c3: 尖 突 , then: t3=? 吻 中长 , 斑鳐 吻 中长 , 斑鳐 是 吻 中长 , 斑鳐 是 鳐形目 吻 中长 , 斑鳐 是 鳐形目 鳐科 的 吻 中长 , 斑鳐 是 鳐形目 鳐科 鳐属 吻 中长 , 斑鳐 是 鳐形目 鳐科 鳐属 的 吻 中长 , 斑鳐 是 鳐形目 鳐科 鳐属 的 1 吻 中长 , 斑鳐 是 鳐形目 鳐科 鳐属 的 1 种 吻 中长 , CTCs of c2 if: one CTC of c2:斑鳐 是 鳐形目 吻 中长 , c3: 尖 突 , then: one group CTCs of c3 is: 尖 突 , 斑鳐 尖 突 , 斑鳐 是 尖 突 , 斑鳐 是 鳐形目 尖 突 , 斑鳐 是 鳐形目 吻 尖 突 , 斑鳐 是 鳐形目 吻 中长 尖 突 , t1 c2的CTCs c3的CTCs How to choose the best path? Question1:How to calculate the value of each node in the CTC tree? CTCs Scoring Function Question2: How to calculate the path value of each leaf node to the root node? Sum of the node value Given a CTC d of PClause c, a topic clause most similar to d is found from the corpus, whose similarity is marked as sim_CT(d). For any two strings x and y, given that their similarity is sim(x,y). sim_CT(d) is defined as Topic Clause Corpus CTset(c) is the CTCs set of c, then the topic clause of c is: Accuracy rate is 0.6499 Reference:Yuru Jiang, Rou Song: Topic Clause Identification Based On Generalized Topic Theory. Journal of Chinese Information Processing. 26(5), (2012) Accuracy rate is 0.7625 0.6499baseline Example3: d_tc

文档评论(0)

book1986 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档