🚢
正在加载 Titanic 数据...
姓名:付东淏 | 学号:22374195
🚢 Titanic 生存分析
基于 1912 年泰坦尼克号乘客数据的可视化分析
891
总乘客数
342
幸存人数
549
遇难人数
38.4%
整体生存率
舱位等级:
全部
一等舱
二等舱
三等舱
性别:
全部
男性
女性
登船港口:
全部
Southampton (S)
Cherbourg (C)
Queenstown (Q)
📊 乘客生存率概览
💡 悬停查看详情
🔍 数据洞察
Titanic 号共有
891
名乘客,最终只有
342
人幸存,整体生存率约为
38.4%
。 从数据可以看出,遇难人数远超过幸存者,比例约为 1.6:1。这场海难之所以造成如此重大的伤亡,主要原因包括:救生艇数量不足、撞击冰山后船体迅速进水、以及事发深夜乘客难以疏散。
🏆 舱位等级与生存率
💡 点击图例切换
🔍 数据洞察
舱位等级对生存率有显著影响。
一等舱乘客生存率高达 63.0%
,二等舱为 47.3%, 而三等舱仅为 24.2%。这一差异反映了多个因素:一等舱位于甲板上方,更容易到达救生艇;乘客社会地位较高,可能享有更多优先权; 同时三等舱乘客多位于船底,撞击后进水最快。
👥 性别与生存率关系
💡 悬停查看详情
🔍 数据洞察
女性生存率高达 74.2%
,而男性仅为 18.9%,差异极为显著。这体现了当时"女士优先"的撤离原则。 尽管如此,仍有超过四分之一的女性不幸遇难,主要原因是三等舱的女性乘客获救机会明显低于一等舱和二等舱。 男性方面,尽管年轻男性体力充沛、更适合参与救援工作,但"让妇女儿童先走"的原则导致男性生存率极低。
📈 年龄分布与生存关系
💡 悬停查看详情
🔍 数据洞察
乘客年龄跨度较大,从婴儿到老年人均有分布。
儿童(0-10岁)生存率最高,达 59.4%
, 再次印证了"妇女儿童优先"的原则。21-30岁的年轻乘客人数最多(229人),但生存率为 36.7%,低于平均水平。 值得注意的是,
高龄乘客(61-70岁)生存率仅 23.5%
,这可能与其体力状况和救生艇可及性有关。 数据中约有 177 名乘客年龄缺失,这些缺失值主要来自三等舱乘客。
💰 票价与生存的关系
💡 悬停查看票价分布
🔍 数据洞察
票价与生存率呈现明显的
正相关关系
。低票价(0-10英镑)的三等舱乘客生存率最低, 而高票价乘客生存率显著更高。
票价超过 100 英镑的乘客生存率最高
。 票价分布呈现明显的右偏态,大多数乘客购买的是低价票,只有少数富裕乘客购买了一等舱的高价票。 这一模式与舱位等级的生存率差异高度一致,票价是舱位等级的量化体现。
🗺️ 登船港口分布
💡 点击查看各港口详情
🔍 数据洞察
Southampton (S) 港
是主要的登船港口,占总乘客的 72.3%(644人),这也是 Titanic 的出发港。
Cherbourg (C) 港
上船的乘客虽然人数较少(18.9%,168人),但生存率相对较高(55.4%), 这与他们多乘坐一等舱有关。
Queenstown (Q) 港
乘客最少(8.6%,77人),基本为三等舱乘客,生存率为 39.0%。 港口分布反映了当时欧洲移民从各港口汇聚前往美洲的历史背景。
👨👩👧👦 家庭规模与生存率
💡 悬停查看详情
🔍 数据洞察
家庭规模(兄弟姐妹/配偶+父母/子女)与生存率呈现
倒 U 型关系
。
3人家庭生存率最高,达 72.4%
;其次是 2人家庭(57.8%)和 1人家庭(55.3%)。 独自旅行的乘客生存率最低(30.4%),因为他们缺乏家庭支持。而大家庭(4人以上)生存率骤降, 4人家庭仅 20.0%,5人家庭仅 13.6%,可能是因为家庭规模过大导致撤离困难、难以找到所有成员。
🔥 多维度生存热力图
💡 颜色越深生存率越高
🔍 数据洞察
热力图综合展示了舱位等级、性别和年龄三个维度的生存率模式。
一等舱女性生存率最高
(接近100%),而
三等舱男性生存率最低
。 可以观察到明显的"阶层效应"和"性别效应"的叠加影响。 儿童在各舱位的生存率都相对较高,但三等舱儿童的生存率仍明显低于一、二等舱。 这一综合视角揭示了 Titanic 救援决策中社会阶层与性别因素的复杂交互。
📋 原始数据样本
💡 筛选后的数据展示
乘客ID
生存状态
舱位
姓名
性别
年龄
兄弟姐妹/配偶数
父母/子女数
票价
登船港口