唐诗相似性比对.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
唐诗相似性比对

唐诗相似性比对 曹俊韩晓综述:功能 检索诗歌:诗歌的查找,录入和输出 检索某个题目的诗歌 核心:题目的相同性,内容的相似性,情感风格的相似性 对诗中某字词的检索 输出某首诗某个方面的相关参数,如情感,季节等 实现方案与结构1 struct element{ int a; int b; char* ch; int c; int d; element* e; }; 实现方案与结构2 struct Node { int serialNum; //诗歌序号 set* title; //标题 set* content;//诗体内容 } 实现方案与结构3 struct set{ int n; element* e; }; 实现方案与结构4 element* creatnewelement(void) //建立一个新的元素 set* creatnewset(void) //建立一个新的元素集合 Node* creatnewnode(void) //建立一个新的储存诗的结构体 void elementcopy(element* a, element* b) //对元素进行复制的操作 void insertelement (set* se, element* el) //向集合中插入一个元素 void readpoem(FILE *fp, Node *p) //将文件指针处的诗歌读入结构体 …… 用途:检验两组(或多组)数据平均数是否相等,即判定两个样本差异性是否显著。 特点:不要求正态母体,只要求样本相互独立。 方法:见《实用生物统计》(第二版)P123。 初衷:为了消除相似性总是为零的影响。 假设:若两首诗歌相似性比较高,则它们的秩和应在两临界值之间。 将内容和题目相似性计算出来的值乘以运用秩和检验数据表得到的数据,若得到的总相似性为0,这说明内容和题目相似性很小,以至于可以忽略,则舍弃内容和题目相似性的数值,另用秩和检验数表得到的数据修正当作相似性的数值。 两总体秩和检验 1 2 5 6 9 10 3 4 7 8 1 2 3 4 5 6 7 8 9 10 查表得: 上限36 下限15 显著性水平:0.05 按啥顺序排的? 秩和检验是不能这样用的! 1夏 2春 3早春 2暮春 0 1 50殘花 3飘零 2落红 1落花 0春殘 季节 103 102 100 出自周克,陈延哲《诗歌相似度计算算法》.ppt第四页 枯藤老树昏鸦, 小桥流水人家。 关于第五个功能的扩展 利用以上的成果和现有字库可以实现多接口的诗歌参数计算。 实质:诗歌与字库的求交运算 暮春:春殘,落花, 落红, 飘零, 辭枝, 殘花,香消, 委泥, 點苔, 亂紅, 墮红, 墜粉, 鶯老,殘紅 春:桃,蕙,鶯,蜂,櫻,蝶,春風,春草,春光,春花,春華,百花,柏酒,爆竹,殘雪,春酒,春雷,春泥,春天,春宵,東風,杜鵑,芳菲,飛絮,寒食,蝴蝶,花柳,黃鸝,黃鳥,黃鶯,蕙蘭,蛺蝶,嬌鶯,鵁鶄,金谷,蘭蓀,爛漫,爛熳,梨花,流鶯,柳花,柳色,柳絮,柳眼,落梅,落絮,落英,鳴鳩,二月,三月,新年,元巳,淑氣,歲華,踏青,桃花,桃李,屠蘇,酴醾,物華,曉鶯,新歲,新葉,新雨,杏花,杏園,陽和,楊花,夭桃,野桃,櫻桃,紫燕,立春,中春,仲春,孟春 作业中遇到的问题 当程序越写越大时,一个地方的错误往往导致几个甚至几十个错误,牵一发而动全身 “写程序真的是一种艺术,是需要精心雕琢的。” 让没有选生统课的韩晓帆做这次报告 总结与展望 由于时间有限,要实现的功能又太过复杂,因此很多思想只能存在于概念之中,已经实现的也并不都尽如人意。 将算法与统计学相结合,可以得到一些意想不到的结论。 如果有足够的支持,如周克、陈延哲同学的同义词的处理的B+树法,也许能够做出更有意义的工作。 THANK YOU! * *

文档评论(0)

cgtk187 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档