- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实操-泰坦尼克号生存预测
模块及库的安装导入各模块数据集处理机器学习模型优化与改进泰坦尼克号生存预测结果分析结论与展望目录CONTENTS
04基于数据分析的假设
数据分析假设我们想知道每个特征与幸存Survived的相关性如何,以便后期建模。事先可以假设:Age年龄特征肯定与幸存相关;Embarked登船港口可能与幸存或其他重要特征相关;Ticket票号包含较高重复率(22%),并且和幸存之间可能没有相关性,因此可能会从我们的分析中删除;Cabin客舱号可能被丢弃,因为它在训练和测试集中缺失值过多(数据高度不完整);PassengerId乘客编号可能会从训练数据集中删除,因为它对幸
原创力文档


文档评论(0)