- 3
- 0
- 约1.04万字
- 约 14页
- 2021-11-11 发布于天津
- 举报
2012年信息科学与技术学院
算法与数据结构专业技能大赛试题
说明:1、不限定开发语言 2、最多不超过5人/题3、题目理解有问题找唐仕喜老师 4、比赛时间为1个 月,到2013年1月1日前截止提交5、10(2)(3)班所有学生都要参加比赛并提交作品,其它班级可参加 6、
学院通过答辩评选择岀一、二、三等奖若干名,并发放证书和奖品
【试题一】对给定文档,依据下面的思想设计聚类算法,并实现,输出聚类结果。
无向加权图Gn V, E,W,V={d1,d2,…,dn};其表示形式为一对称矩阵:
[wij]n x n,其中W={w1, w2,…,wm}是边权重代表两个文本间相似度。 计算文档的词
频以及文档间的相似度,将文档粗化的聚成 无关或是相关度极小 的c个文档子类。首先除去 在所有文档中出现的 高频词;然后提取剩下词汇的短语存入词根表中。 收集这些短语形成一
个索引短语集T。短语t在文档di中权重为:
tfij 定义为短语t在文档中di出现的频率;dft定义为含有短语t的文档数量;L定
义为文档di中包含的索引短语的数量; N定义为文档的数量。p_term_documen (tt , di )
的值代表着短语t在文档di中的重要性,取值范围是[0,1]。计算出短语的权重,可以将 短语表示成向量:di= (wi1,wi2,…,wis ),其中0 wij 1,s代表索引短语表中词的数 量
您可能关注的文档
- 2011年浙江省学业考试科学试题汇编.docx
- 2011电大工商管理本科人力资源考试复习汇总.docx
- 2011海淀文数一模.docx
- 2012《企业集团财务管理系统》案例.docx
- 2012中学考试物理分类总汇编——1声现象.docx
- 2012年11月楼市信息收集、各版块成交均价.docx
- 2012周围的空气汇编.docx
- 2012年中超赛程公布.docx
- 2012年定量装车工岗位技能竞赛理论试题题库成庄10月修改_.docx
- 2012年学业水平模拟测试物理试题.docx
- 2026新疆塔城地区检察机关面向社会考试招聘聘用制书记员13人备考题库带答案详解(名师推荐).docx
- 2026日照银行第一次社会招聘100人备考题库及答案详解(名师系列).docx
- 2026春季中国移动校园招聘备考题库精选答案详解.docx
- 中铁二十一局集团有限公司企业报告供应商版.docx
- 中科院上海原子核研究所简介.docx
- 中科院苏州医工所研究和管理部门机构设置方案及职责模板.docx
- 2026春季乐山市商业银行校园招聘100人备考题库附答案详解(培优b卷).docx
- 中通建设股份有限公司述职报告制度.docx
- 2026新疆得仁水务发展有限公司市场化选聘公司及子公司管理人员6人备考题库含答案详解(综合卷).docx
- 2026新疆塔城地区检察机关面向社会考试招聘聘用制书记员13人备考题库含答案详解(名师推荐).docx
最近下载
- 新生儿艾梅乙制度流程.docx VIP
- 北京地铁DKZ5--新题库-电气.doc VIP
- 9宫格数独专项练习题(每日一练,初级、中级、高级各32套题).pdf VIP
- 宣贯培训(2026)《GBT 983-2012不锈钢焊条》.pptx VIP
- 数字化转型下的企业组织架构设计.docx VIP
- 员工消防安全教育培训记录表模板.pdf VIP
- 6.2《青纱帐——甘蔗林》-【中职专用】高一语文同步精品课件(高教版2023·基础模块下册).pptx VIP
- 中国飞机维修商业计划书.docx VIP
- (高清版)DB15∕T 3629—2024 水性环氧树脂乳化沥青混合料冷再生技术规范.pdf VIP
- 农业生产人员安全培训课件.pptx VIP
原创力文档

文档评论(0)