数据建模工程师编程能力考核PythonR题目集.docxVIP

数据建模工程师编程能力考核PythonR题目集.docx

本文档由用户AI专业辅助创建,并经网站质量审核通过
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第PAGE页共NUMPAGES页

数据建模工程师编程能力考核PythonR题目集

一、基础语法与数据结构(共5题,每题4分,总分20分)

1.题目:

请编写Python代码,定义一个字典`student_info`,包含学生姓名(`Alice`)、年龄(`25`)、专业(`DataScience`)和成绩(`{Math:88,English:92}`),然后输出该字典中所有键值对,并删除成绩中的`English`键值对。

2.题目:

实现一个函数`count_vowels(s)`,接收一个字符串`s`,返回其中元音字母(`a,e,i,o,u`)的数量。例如:`count_vowels(HelloWorld)`应返回`3`。

3.题目:

使用列表推导式生成一个包含1到100(含)所有偶数的列表,并使用`sum()`函数计算其总和。

4.题目:

编写Python代码,定义一个类`Rectangle`,包含宽(`width`)和高(`height`)两个属性,并实现一个方法`area()`计算矩形面积。创建一个实例并输出其面积。

5.题目:

使用Python中的`set`数据结构,编写代码实现:给定两个列表`list1=[1,2,3,4,5]`和`list2=[4,5,6,7,8]`,找出它们的交集、并集和差集。

二、数据处理与分析(共5题,每题6分,总分30分)

6.题目:

使用Pandas库,读取名为`sales.csv`的文件(假设该文件包含`date`(日期)、`product`(产品)、`quantity`(数量)、`price`(单价)四列),筛选出2023年1月的销售数据,并计算每种产品的总销售额。

7.题目:

使用Pandas库,读取名为`customer.csv`的文件(假设包含`age`(年龄)、`gender`(性别)、`purchase`(是否购买)三列),计算不同性别用户的购买率(购买人数/总人数),并按购买率降序排序。

8.题目:

使用Pandas库,读取名为`stock.csv`的文件(假设包含`date`(日期)、`open`(开盘价)、`close`(收盘价)三列),计算每天的价格波动(`close-open`),并找出波动最大的3天。

9.题目:

使用Pandas库,读取名为`employee.csv`的文件(假设包含`department`(部门)、`salary`(工资)两列),计算每个部门的平均工资,并找出平均工资最高的部门。

10.题目:

使用Pandas库,读取名为`weather.csv`的文件(假设包含`date`(日期)、`temperature`(温度)、`precipitation`(降水量)三列),计算每个月的平均温度和总降水量,并保存到新的CSV文件`monthly_weather.csv`中。

三、数据可视化(共3题,每题10分,总分30分)

11.题目:

使用Matplotlib库,读取名为`sales.csv`的文件(假设包含`month`(月份)、`sales`(销售额)两列),绘制折线图展示每月销售额的变化趋势,并添加标题、坐标轴标签和图例。

12.题目:

使用Seaborn库,读取名为`customer.csv`的文件(假设包含`age`(年龄)、`gender`(性别)、`purchase`(是否购买)三列),绘制柱状图比较不同性别用户的购买率,并添加数据标签。

13.题目:

使用Matplotlib库,读取名为`stock.csv`的文件(假设包含`date`(日期)、`open`(开盘价)、`close`(收盘价)三列),绘制蜡烛图(K线图)展示股价变化,并设置日期为X轴。

四、机器学习基础(共5题,每题6分,总分30分)

14.题目:

使用Scikit-learn库,读取名为`iris.csv`的文件(假设包含`sepal_length`(花萼长度)、`sepal_width`(花萼宽度)、`petal_length`(花瓣长度)、`petal_width`(花瓣宽度)、`species`(种类)五列),将数据分为训练集和测试集(80%/20%),并使用K-NearestNeighbors(KNN)算法进行分类。

15.题目:

使用Scikit-learn库,读取名为`housing.csv`的文件(假设包含`area`(面积)、`bedrooms`(卧室数量)、`price`(价格)三列),将数据分为训练集和测试集(70%/30%),并使用线性回归模型预测房价。

16.题目:

使用Scikit-learn库,读取名为`diabetes.csv`的文件(假设包含

文档评论(0)

旺咖 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档