Python大数据分析与挖掘实战课件 10-6.方案评价.pptxVIP

Python大数据分析与挖掘实战课件 10-6.方案评价.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第10章众包任务定价优化方案任务完成增加量完整实现代码成本增加额

任务完成增加量第10章任务完成增加量表示新方案与旧方案的执行任务数量差。通过将此前计算的12个指标和任务数据中的任务定价共13个指标数据作为自变量,任务完成情况指标数据作为因变量,训练支持向量机分类模型,并对任务数据中未执行任务重新定价后的执行情况进行分类预测。xx=pd.concat((Data,A.iloc[:,[3]]),axis=1)#12个指标和附件1的任务定价作为自变量xx=xx.as_matrix()#转化为数组yy=A4.reshape(len(A4),1)#任务执行情况指标数据作为因变量#对自变量与因变量按训练80%、测试20%随机拆分fromsklearn.model_selectionimporttrain_test_splitxx_train,xx_test,yy_train,yy_test=train_test_split(xx,yy,test_size=0.2,random_state=4)(1)构造训练数据和测试数据。示例代码如下:

任务完成增加量第10章执行结果如下:任务完成增加量:68执行结果如下:模型准确率:0.7140718562874252预测准确率:0.6826347305389222(3)计算任务完成增加量,示例代码如下:xx_0=np.hstack((Z[A4==0,1:],y_0r.reshape(len(y_0r),1)))#预测自变量P=clf.predict(xx_0)#预测结果,1表示被执行,0表示未被执行R1=len(P[P==1])#预测被执行的个数R1=int(R1*rv3)#任务完成增加量print(任务完成增加量:,R1)fromsklearnimportsvm#用高斯核,训练数据类别标签作平衡策略clf=svm.SVC(kernel=linear,class_weight=balanced)clf.fit(xx_train,yy_train)rv2=clf.score(xx_train,yy_train);#模型准确率yy1=clf.predict(xx_test)yy1=yy1.reshape(len(yy1),1)r=yy_test-yy1rv3=len(r[r==0])/len(r)#预测准确率print(模型准确率:,rv2)print(预测准确率:,rv3)(2)导入支持向量机模型,并利用随机拆分的训练数据训练支持向量机模型,同时显示预测准确率。示例代码如下:

成本增加额第10章成本增加额的计算很简单,直接利用未执行任务的新定价减去原定价即可。示例代码如下:R2=sum(y_0r)-sum(y_0)#成本增加额print(成本增加额:,R2)执行结果如下:成本增加额:[-34从结果可以看出,新定价方案不仅使得任务完成增加量有所提高,同时成本略有减少。

完整实现代码第10章下面给出任务定价模型构建和方案评价的完整实现代码。完整示例代码如下:importnumpyasnpimportpandasaspdZ=np.load(Z.npy)Data=pd.DataFrame(Z[:,1:])Data=Data.fillna(0)R=Data.corr()fromsklearn.preprocessingimportStandardScalerscaler=StandardScaler()data=Data.values#数据框转化为数组形式scaler.fit(data)data=scaler.transform(data)fromsklearn.decompositionimportPCApca=PCA(n_components=0.9)#累计贡献率提取在0.9以上pca.fit(data)x=pca.transform(data)#返回主成分tzxl=ponents_#特征向量tz=pca.explained_variance_#特征值gxl=pca.explained_variance_ratio_#累计贡献率

完整实现代码第10章#线性回归A=pd.read_excel(附件1:已结束项目任务数据.xls)A4=A.iloc[:,4].valuesx_0=x[A4==0,:]#未执行任务主成分数据x_1=x[A4==1,:]#执行任务主成分数据y=A.iloc[:,3

您可能关注的文档

文档评论(0)

释然 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档