- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE
PAGE55
PAGE
PAGE1
基于python的近几年大学生就业选择变化趋势分析
摘要
大数据时代背景下,传统的就业指导显现出诸多弊端,利用大数据对当今就业形势进行分析显得尤其重要。利用爬虫获取某招聘网站近些年相关就业数据,利用已有的数据进行处理分词聚类,确定各个领域的关键词,之后借助频率统计与决策树模型,对各个地区、不同的职业方向和岗位、不同学历带来的招聘优势之间的差距进行分析,为就业指导提供帮助。通过分析可以看出,IT行业为现在最热门的行业,技术领域也最有价值,北京、上海、广州、深圳四大城市依然是人才招聘最集中的地方,有工作经验与高学历的人会更受欢迎。通过基于大数据的分析与挖掘可以为在校大学生根据自身情况、需求、目标量体裁衣,提供一个更有价值的就业选择。
【关键词】大学生;就业选择;网络爬虫
目录
TOC\o1-3\h\u
21356第1章引言 1
22280第2章大学生就业与网络爬虫技术改善 2
299622.1大学生就业现状 2
201462.2网络爬虫技术 2
23584第3章爬虫的设计 5
11113.1系统需求及分析 5
315133.2爬虫模块设计 5
260673.2.1爬虫整体设计思路 5
84703.2.2爬虫的网页抓取模块 6
9363.2.3网页源码分析模块 6
191533.2.4信息获取模块 6
258273.2.5MySQL数据库的联合使用 7
21370第4章数据结果分析 9
284184.1热门行业分析 9
198284.2热门职位分析 9
108034.3热门地域分析 10
189834.4工作经验 11
11366第5章结论 13
20804参考文献 14
第1章引言
近年来我国招聘行业发展迅速,然而,如何使求职者全面充分了解真实的用人单位需求,如何让用人单位能更加便捷高效的匹配到所需的人才,一直都是社会多方人士所考虑的问题。与此同时,大学生在求职过程中始终存在着技能与岗位不匹配的问题,双方信息的不对称,也大大增加了招聘的成本。招聘行业的转型,已经成为了一个紧迫需要解决的问题。根据我国国家统计局所发布的相关统计的数据显示,全国范围之内我国的目前在校大学生约为2695.8万,用户规模大,这使得技能共享的市场十分广阔,同时,据央视报道,到2020年,高端技术人才缺口将会达到2200万,这表明社会对于技能型人才的需求也在日益增长。新时期我国的众多高校在开展大学生就业指导工作的过程中,应用利用好大数据技术,应能够转变传统模式,让技术科技在就业领域发挥作用,让我们对大数据的优势进行充分的利用。
第2章大学生就业与网络爬虫技术改善
2.1大学生就业现状
自步入互联网时代,随着社会的不断进步发展,我国高等教育的面向群体和教育规模不断扩大,高等教育就业率不断提高:2010年631万,2015年749万,2020年874万;每年如此庞大的毕业生数量,就业岗位和数量有限,因此导致大学生每毕业季来临就业形势异常严峻,竞争异常激烈。今天我们有超过十亿的就业机会,到2025年,这一现象将不再趋于稳定。这说明我国大学生的数量相对偏多。但据民政部门及地方人才市场相关调查结果显示,目前我国许多岗位目前仍然存在缺口,大学生就业难的关键性问题在于结构性矛盾。
自国家改革开放以来,公私合营,国家持股,公司制的出现,以前的毕业包分配制度已经不再适用于当代的大学生了,现在迈出高校大门的大学生们,在完成学业,能够自由选择职业方向岗位的同时,也有着“毕业即失业”的现象。“双向选择,自主择业”的就业模式便要求现在的大学生在进行择业的过程中,既要结合自身特长、社会需求,又要充分发挥自身潜能,不要盲从,根据自己实际出发为自己“私人订制”一份专属的职业发展路径。
2.2网络爬虫技术
我们现在所要运用的是python编程语言,是一种编写录入简单并且功能强大的适合于计算机程序设计的语言,它主要是通过采用高效的低级数据结构,从而为开发者提供简单并且高效的面向对象编程。简洁明了采用便于操作的python语法和对各种动态输入的功能性支持,使阅读、调试和扩展都变得更加简单清晰明了,同时也充分地使得python语言高度地集成了交互性、面向对象性、解释力和丰富的可扩展性于一体的特征,可提前根据实际需要同时导入多个模块,从而获取到第三方函数库的广泛全面支撑,这也就使得当下python类型的语言具备课了独树一帜的新颖优势,因此也就使得当下python类型的语言特别适合于应用快速开发,python类型的语言也被认为是当今所有应用程序设
您可能关注的文档
- 【“双减政策”下新东方的发展内外部环境及发展战略分析12000字】.docx
- 【20万吨年产量的磷酸一铵工艺设计14000字】.docx
- 【A公司的大客户管理存在问题及优化方案设计14000字】.docx
- 【J市物流发展研究的理论基础与文献综述7400字】.docx
- 【PPP项目违约追责问题研究的理论基础与相关规定综述8500字】.docx
- 【S隧道箱式变电站供配电系统设计(附接线图)8700字】.docx
- 【T县校外篮球培训班学员情况的问卷调查研究(附问卷)8500字】.docx
- 【W城市污水处理工艺设计分析论文22000字】.doc
- 【XX机械厂CA6150数控车床主传动系统创新设计11000字论文】.doc
- 【安徽古井贡酒公司资产负债表分析及优化方案设计5700字】.doc
- 【基于财务角度的海尔智家投资价值分析案例综述2300字】.docx
- 【基于单片机的水循环温度控制设计15000字】.doc
- 【基于单片机的智能火灾报警系统设计14000字】.docx
- 【基于单片机和LCD的电子防潮箱看板设计6900字】.docx
- 【基于发展战略的B日化集团财务分析案例报告10000字】.doc
- 【基于功效系数法的J汽车企业财务绩效评价研究8000字】.doc
- 【基于哈佛分析框架的古井贡酒公司财务报表分析论文任务书】.docx
- 【基于灰色关联度的中国出口美国纺织品影响因素实证分析13000字】.docx
- 【基于灰色关联度模型的H市房价分析及预测研究5700字】.doc
- 【基于近三年数据的温州报喜鸟公司营运能力存在的问题及解决对策8900字】.docx
文档评论(0)