- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大学毕业设计论文创新创业申请书微博数据分析与管理及热点信息挖取与分析
江苏省高等学校
大学生实践创新训练计划项目申报表
推荐学校: (盖章) 项目名称: 微博数据分析与管理及热点信息挖取与分析 项目类型: □ √重点项目
□ 一般项目
□ 指导项目 所属一级学科名称: 工学 项目负责人: 陈梦园 联系电话: 指导教师: 曲维光 联系电话: 申报日期: 2013年5月15日
江苏省教育厅 制
二○一二年五月
项目名称 微博数据分析与管理及热点信息挖取与分析 项目关键词 网络爬虫 微博反垃圾内容处理 群众观点挖掘 热点信息分析 项目所属
一级学科 工学 项目类型 (√)重点项目 ( )一般项目 ( )指导项目 项目实施时间 起始时间: 2013 年 6 月 完成时间: 2014年 12 月 项目简介
(100字以内) 本项目通过网络爬虫爬取网络用户微博信息,对网络信息处理分析,得到网络新词等语料数据。通过对微博用户的语言处理分析,总结出网络用语习惯,纠正错误语法习惯,改善网络语言环境。通过热点事件的发现与分析,了解社会舆论导向。 申请人或申请团队 姓名 年级 学号 所在院系
/专业 联系电话 E-mail 主
持
人 陈梦园 2011计算机院/计算机科学与技术852797697@ 严杰 2011计算机院/计算机科学与技术865173428@ 成
员 程鹏鹏 2011计算机院/计算机科学与技术1018423717@ 无 无 无 无 无 无 无 无 无 无 无 无 指导教师 第一指导教师 姓名 曲维光 单位 南京师范大学计算机科学与技术学院 年龄 48 专业技术职务 南京师范大学计算机科学与技术学院教授、博导 主要成果 曲维光,男,1964年12月生于黑龙江省哈尔滨市,中共党员,博士,教授,博士生导师。目前担任副院长,分管本科生教学。2009年4月至今担任学院党委委员,负责青年工作。 1987年毕业于大连工学院计算机系,获得学士学位;1990年毕业于哈尔滨船舶工程学院计算机系,获得硕士学位;1999年9月至2000年8月在美国Union College访学一年;2005年毕业于南京师范大学文学院,获得博士学位。2006年至2007年在北京大学信息学院计算语言学研究所从事博士后研究工作。 1997年至今在南师大从事计算机专业的教学和科研工作,主要研究方向为自然语言处理,计算语言学、语言工程、人工智能。主持过国家自然科学基金、江苏省社科基金、江苏省教育厅社科基金、国家“973”子任务等科研项目,2006年获得国家博士后科学基金一等资助。出版专著一部,发表学术论文40余篇,其中被EI检索10余篇。担任过《自然语言处理》《操作系统》、《人工智能》和《面向对象程序设计》等十多门计算机本科和研究生专业课程。主持或参与省级和校级多项教学改革研究项目。先后获得江苏省第七届哲学社科奖二等奖,江苏省教育厅第十一届哲学社科奖二等奖,江苏省教学成果二等奖(排名第二)和南京师范大学教学成果一等奖(排名第三)。2003年7月荣获南京师范大学“优秀共产党员”称号。 目前担任中国计算机学会高级会员、中国计算机学会中文信息技术专委会委员和办公自动化专业委员会委员、中国人工智能学会机器学习专委会委员、中国科学技术情报学会知识组织专业委员会委员。
第二指导教师 姓名 无 单位 无 年龄 无 专业技术职务 无 主要成果 无 申请理由(包括自身具备的知识条件自己的特长、兴趣 二、项目方案
具体内容包括:
(一)项目研究背景(国内外的研究现状及研究意义、项目已有的基础,与本项目有关的研究积累和已取得的成绩,已具备的条件,尚缺少的条件及方法等)
(一)选题背景
随着微博平台功能的日益的完善,近年来,各种微博应用软件越发受到网络用户的喜爱。用户们使用微博记录生活的点滴,分享兴趣爱好和发表意见评论。与传统网络媒体数据相比,微博具有一些独特的特点,包括长度短、规模大、质量低、实时传播和社交网络等。因此对微博数据挖掘研究提出了一些挑战:
由于微博消息长度较短,传统的长文本的挖掘算法无法直接用于微博消息,因而需要研究适合微博的短文本挖掘算法等
微博消息是一种“用户生成内容”,消息文本中包含网络新词,拼写错误和缩写等。因此微博消息文本质量有限,仅依靠现有的自然语言处理技术是不够的,需要不断地发展新的文本处理技术解决上述问题。
微博数据规模巨大,要求数据挖掘算法具有高效性和可伸缩性。
微博除了含有大量的文本数据以外,还包含大量的非结
您可能关注的文档
- 大学毕业设计论文c++课程设计打砖块游戏.doc
- 大学毕业设计论文c++课程设计打砖块游戏0.doc
- 大学毕业设计论文c++课程设计对参赛结果分数进行处理.doc
- 大学毕业设计论文c++课程设计俄罗斯方块游戏.doc
- 大学毕业设计论文c++课程设计俄罗斯方块游戏1.doc
- 大学毕业设计论文c++-课程设计基于反弹socket通信的windows系统后门实现.doc
- 大学毕业设计论文c++课程设计计算器7.doc
- 大学毕业设计论文c++课程设计计算器课程设计.doc
- 大学毕业设计论文c++课程设计连连看1.doc
- 大学毕业设计论文c++课程设计连连看游戏1.doc
- 大学毕业设计论文创新创业申请书中国大学生理想与学习惰性调查.doc
- 大学毕业设计论文创意之都售楼处物业服务方案.doc
- 大学毕业设计论文创意之都售楼处物业服务方案 精品.doc
- 大学毕业设计论文创意平板折叠桌数学建模竞赛获奖论文.doc
- 大学毕业设计论文慈溪市胜山镇道路、河道保洁服务.doc
- 大学毕业设计论文慈溪—绿城园区生活服务体系—建设方案.doc
- 大学毕业设计论文醇—水二元体系浮阀精馏塔的工艺设计—化工原理-课程设计.doc
- 大学毕业设计论文从采购目标与谈判风格浅谈采购谈判论文.doc
- 大学毕业设计论文从外汇储备的视角来看我国流动性过剩问题 精品.doc
- 大学毕业设计论文从外汇储备的视角来看我国流动性过剩问题.doc
最近下载
- 《第5课 共同保卫伟大祖国》课件_初中道德与法治_七年级全一册_中华民族大团结.pptx VIP
- h3cloud云学堂故障处理手册.pdf VIP
- 2025-2026学年重庆市巴蜀中学学堂班八年级(上)选拔数学试卷(含答案).pdf VIP
- 第5课 共同保卫伟大祖国 课件中华民族大团结.ppt VIP
- GB50819-2013 油气田集输管道施工规范.pdf VIP
- 沥青混凝土面层工程检验批质量验收记录表.doc VIP
- 人教PEP版四年级英语下册 《Weather》Part A PPT课件(第1课时) .ppt VIP
- 《文化的继承与创新》课件.ppt VIP
- 百冠公司成品仓库仓储货位优化研究.docx
- 2024光伏连接器技术标准.docx VIP
文档评论(0)