首页
建站知识
建站知识
/
2025/2/8 13:33:46
http://www.tqpw.cn/hL0AmKPF.shtml
相关文章
kaggle经典题--“泰坦尼克号”--0.8275准确率--东北大学20级python大作业开源(附详细解法与全部代码以及实验报告)
kaggle经典题--“泰坦尼克号”--0.8275准确率--东北大学20级python大作业开源(附详细解法与全部代码以及实验报告) 前言开发环境一、导入包:二、实验数据的读取,合并,以及显示info三、数据的预处理(1&#…
阅读更多...
python归一化 增大差异_练习赛1:Titanic
0 问题概述 根据给出的乘客特征(年龄、舱室等级、登陆港口等),预测乘客是否幸存,属于典型的分类问题。 数据文件: train.csv 训练集,包含1-891个记录 test.csv 测试集,包含892-1309的记录,不包含是否生存的label gender_submission.csv 提交样例,测试集对应的是否生存la…
阅读更多...
泰坦尼克号乘客存活预测详细笔记
说明 因为自己当前在学习机器学习,而且是第一次练习kaggle上的习题,所以花费了不少的精力做了详细的笔记,每一步都有详细的结果和图像展示。但笔记是用Jupyter Notebook写的,所以没法写在博客上。目前已经上传到GitHub上ÿ…
阅读更多...
利用泰坦尼克号数据集进行机器学习
最近在学习pytorch深度学习实践,记录一下处理这个数据集以及利用其训练网络的过程。 数据集位置:泰坦尼克号数据集 1. 数据集处理 可以在jupyter notebook上先跑一跑,看看数据集的样子 import numpy import pandas as pd from sklearn impo…
阅读更多...
《吊打分析师》实战—经典重现,你会怎么选择?
2020,努力做一个无可替代的人! 长文多图,建议先收藏再看 作者|小一 全文共5683字,阅读全文需19分钟 写在前面的话 你好,我是小一 今天的实战项目是一个比赛项目,小一我通过分析和建模杀入了Top10% 害&#…
阅读更多...
机器学习实战——kaggle 泰坦尼克号生存预测——六种算法模型实现与比较
一、初识 kaggle kaggle是一个非常适合初学者去实操实战技能的一个网站,它可以根据你做的项目来评估你的得分和排名。让你对自己的能力有更清楚的了解,当然,在这个网站上,也有很多项目的教程,可以跟着教程走ÿ…
阅读更多...
titanic生存率数据分析
该例程通过分析titanic数据中个各个特征来判断最后是否获救。例程背景就不多说了,网上到处都有。 该例程是到目前kaggle上讨论最多,关注度最高,最活跃的一个,其中有对数据处理的常见的方法如:缺失值处理、类别值处理&…
阅读更多...
深度学习之构建MPL神经网络——泰坦尼克号乘客的生存分析
大家好,我是带我去滑雪! 本期使用泰坦尼克号数据集,该数据集的响应变量为乘客是生存还是死亡(survived,其中1表示生存,0表示死亡),特征变量有乘客舱位等级(pclass&#x…
阅读更多...
动手学数据分析Task2第一节数据清洗及特征处理
第二章:数据清洗及特征处理 我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据…
阅读更多...
泰坦尼克号乘客生存情况分析之第二部分特征工程
第二部分 特征工程 继第一部分数据探索性分析,今天主要介绍下第二部分特征工程。原始数据肯定不能直接拿来分析,因为数据比较杂乱,就算分析的话,也得不到有价值的信息,所以需要进行数据处理,处理成我们想要…
阅读更多...
python数据挖掘框架_来自Kaggle金牌得主的Python数据挖掘框架,一文学会机器学习基本流程!...
目录项目背景与分析 数据读入与检查 数据预处理数据校正 缺失值填充 数据创建 数据转换 数据清洗 数据划分 探索性分析 建模分析 模型评估与优化交叉验证 超参数调整 特征选择 模型验证 改进与总结 项目背景与分析 泰坦尼克号沉没是历史上有名的沉船事件之一。1912年4月15日&am…
阅读更多...
动手学数据分析 TASK2 数据清洗及特征处理
本篇主要解决数据清洗和数据的特征处理问题,数据清洗包括缺失值、重复值的处理、字符串数据转换等,此项过程为数据分析的前序环节起铺垫作用。 2 第二章:数据清洗及特征处理 知识概要 缺失值和重复值的观察与处理 数据的分箱处理 文本变量转…
阅读更多...
Kaggle泰坦尼克号预测——Last
整理了一下全部流程,写成了一个ipynb文件 导入数据集 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings(ignore)##载入数据集 data_path = D:/Now/Titanic/train_data = pd.read_cs…
阅读更多...
来自Kaggle金牌得主的Python数据挖掘框架,一文学会机器学习基本流程!
导读 很多同学在学习机器学习时往往掉进了不停看书、刷视频的,但缺少实际项目训练的坑,有时想去练习却又找不到一个足够完整的教程,本项目翻译自kaggle入门项目Titanic金牌获得者的Kernel,该篇文章通过大家并不陌生的泰坦尼克数据…
阅读更多...
kaggle_泰坦尼克实战入门
前言 为了记录自己的学习过程,我把分析的过程大致整理了一下,工具是使用jupyter notebook,个人比较喜欢,然后导出成md格式,传到csdn和大家做一个分享; 这次只是一个简单的分析过程,所以相对来说比较简单,如…
阅读更多...
泰坦尼克号乘客生存情况预测分析总
🌟欢迎来到 我的博客 —— 探索技术的无限可能! 🌟博客的简介(文章目录) 泰坦尼克号乘客生存情况预测分析1 泰坦尼克号乘客生存情况预测分析2 泰坦尼克号乘客生存情况预测分析3 泰坦尼克号乘客生存情况预测分析总 背景…
阅读更多...
Python28-6 随机森林
随机森林算法详细介绍 1. 理论背景 随机森林(Random Forest)是一种由Leo Breiman和Adele Cutler在2001年提出的集成学习方法。它结合了多个决策树的预测结果,以提高模型的准确性和鲁棒性。 2. 算法细节 随机森林的构建过程可以分为以下几…
阅读更多...
Titanic(Kaggle)-数据处理(1)
数据集介绍: PassengerId乘客编号,Survived是否被救, Parch 父母子女数量,SibSP兄弟姐妹配偶数, Pclass客舱等级, Pclass登船港口,Ticket票号,Fare票价,Cabin客舱号 Cabi…
阅读更多...
Kaggle机器学习入门课程 泰坦尼克号数据科学解决方案中文翻译
泰坦尼克号数据科学解决方案 该笔记本引导我们了解在Kaggle等网站上解决数据科学竞赛的典型工作流程。 有几个优秀的notebooks可以研究数据科学竞赛的参赛作品。然而,许多notebooks会跳过一些关于解决方案开发的解释,因为这些笔记本是为专家开发的&…
阅读更多...
泰坦尼克号数据处理与预测
♚ 作者:罗罗攀,林学的研究僧。Python中文社区专栏作者,《从零开始学Python网络爬虫》作者。《从零开始学Python数据分析:视频教学版》作者。 之前我们用过传统的机器学习算法预测过泰坦尼克号数据的生还情况,这次我们…
阅读更多...
推荐文章
【VCS】Verdi常用指令
CCID枚举
寻根究底,探讨 chi -square特征词选择方法后面的数学支持
vue ui 创建新项目时断开连接
sprintf函数,va_list(),va_start(),va_arg(),va_end()
c语言va_start函数,va_start和va_end,以及c语言中的可变参数原理
赤手空拳如何成就百万富翁? 赤手空拳如何成就百万富翁?——网络营销之七(第四招:百度文库+)...
有道云笔记不同步_有道云笔记不能同步解决教程 有道云笔记突然出现无法同步失败如何办...
做自媒体必备,16个高质量素材网站
不懂技术,自己如何做网站?
网站友情链接怎么做最好,友情链接如何做详细解读
旅游网站设计制作方案
python程序设计试题及答案_《Python程序设计》习题与答案
PHP设计模式之策略模式
mysql单个查询_MySQL单表查询实例详解
java数据结构编程问题_一道java数据结构编程题。
pytorch泰坦尼克号幸存者预测(二分类)
游标定义与使用