Python大数据分析与挖掘实战课件 10-6.方案评价.pptxVIP

下载本文档

0
0
约3.41千字
约 8页
2025-06-18 发布于山东
举报
版权申诉

Python大数据分析与挖掘实战课件 10-6.方案评价.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第10章众包任务定价优化方案任务完成增加量完整实现代码成本增加额

任务完成增加量第10章任务完成增加量表示新方案与旧方案的执行任务数量差。通过将此前计算的12个指标和任务数据中的任务定价共13个指标数据作为自变量，任务完成情况指标数据作为因变量，训练支持向量机分类模型，并对任务数据中未执行任务重新定价后的执行情况进行分类预测。xx=pd.concat((Data,A.iloc[:,[3]]),axis=1)#12个指标和附件1的任务定价作为自变量xx=xx.as_matrix()#转化为数组yy=A4.reshape(len(A4),1)#任务执行情况指标数据作为因变量#对自变量与因变量按训练80%、测试20%随机拆分fromsklearn.model_selectionimporttrain_test_splitxx_train,xx_test,yy_train,yy_test=train_test_split(xx,yy,test_size=0.2,random_state=4)(1)构造训练数据和测试数据。示例代码如下：

任务完成增加量第10章执行结果如下：任务完成增加量：68执行结果如下：模型准确率：0.7140718562874252预测准确率：0.6826347305389222(3)计算任务完成增加量，示例代码如下：xx_0=np.hstack((Z[A4==0,1:],y_0r.reshape(len(y_0r),1)))#预测自变量P=clf.predict(xx_0)#预测结果，1表示被执行，0表示未被执行R1=len(P[P==1])#预测被执行的个数R1=int(R1*rv3)#任务完成增加量print(任务完成增加量：,R1)fromsklearnimportsvm#用高斯核，训练数据类别标签作平衡策略clf=svm.SVC(kernel=linear,class_weight=balanced)clf.fit(xx_train,yy_train)rv2=clf.score(xx_train,yy_train);#模型准确率yy1=clf.predict(xx_test)yy1=yy1.reshape(len(yy1),1)r=yy_test-yy1rv3=len(r[r==0])/len(r)#预测准确率print(模型准确率：,rv2)print(预测准确率：,rv3)(2)导入支持向量机模型，并利用随机拆分的训练数据训练支持向量机模型，同时显示预测准确率。示例代码如下：

成本增加额第10章成本增加额的计算很简单，直接利用未执行任务的新定价减去原定价即可。示例代码如下：R2=sum(y_0r)-sum(y_0)#成本增加额print(成本增加额：,R2)执行结果如下：成本增加额：[-34从结果可以看出，新定价方案不仅使得任务完成增加量有所提高，同时成本略有减少。

完整实现代码第10章下面给出任务定价模型构建和方案评价的完整实现代码。完整示例代码如下：importnumpyasnpimportpandasaspdZ=np.load(Z.npy)Data=pd.DataFrame(Z[:,1:])Data=Data.fillna(0)R=Data.corr()fromsklearn.preprocessingimportStandardScalerscaler=StandardScaler()data=Data.values#数据框转化为数组形式scaler.fit(data)data=scaler.transform(data)fromsklearn.decompositionimportPCApca=PCA(n_components=0.9)#累计贡献率提取在0.9以上pca.fit(data)x=pca.transform(data)#返回主成分tzxl=ponents_#特征向量tz=pca.explained_variance_#特征值gxl=pca.explained_variance_ratio_#累计贡献率

完整实现代码第10章#线性回归A=pd.read_excel(附件1：已结束项目任务数据.xls)A4=A.iloc[:,4].valuesx_0=x[A4==0,:]#未执行任务主成分数据x_1=x[A4==1,:]#执行任务主成分数据y=A.iloc[:,3