Python 数据可视化实战：从入门到精通，手把手教你打造炫酷图表

2025/3/2 00:25:16 41 0 0 0

1. 准备工作：安装 Python 和可视化库

2. Matplotlib 入门：绘制基础图表

2.1 绘制折线图

2.2 绘制散点图

2.3 绘制柱状图

2.4 绘制饼图

3. Seaborn 进阶：绘制更美观的图表

3.1 绘制散点图（Seaborn）

3.2 绘制线性回归图（Seaborn）

3.3 绘制箱线图（Seaborn）

3.4 绘制热力图（Seaborn）

4. Plotly 进阶：绘制交互式图表

4.1 绘制折线图（Plotly）

4.2 绘制散点图（Plotly）

4.3 绘制柱状图（Plotly）

4.4 绘制饼图（Plotly）

5. Pandas 与数据可视化：数据处理与图表结合

5.1 Pandas 与 Matplotlib

5.2 Pandas 与 Seaborn

5.3 Pandas 与 Plotly

6. 数据可视化进阶技巧

6.1 图表美化

6.2 多图表组合

6.3 数据预处理与清洗

7. 案例实战：分析真实数据集

7.1 数据加载与预处理

7.2 数据可视化分析

7.2.1 生存人数统计

7.2.2 不同性别生存率分析

7.2.3 不同船舱等级生存率分析

7.2.4 年龄与生存关系分析

7.2.5 票价与生存关系分析

7.3 分析总结

8. 总结与展望

数据可视化是数据分析中至关重要的一环，它能够将抽象的数据转化为直观的图形，帮助我们更好地理解数据背后的规律和趋势。Python 作为一门强大的编程语言，拥有丰富的数据可视化库，例如 Matplotlib、Seaborn、Plotly 等，能够满足各种可视化需求。本文将带领大家从零开始，学习如何使用 Python 进行数据可视化，并通过具体的代码示例，让大家能够轻松上手，打造属于自己的炫酷图表。

1. 准备工作：安装 Python 和可视化库

在开始之前，我们需要确保已经安装了 Python，并且安装了本文中将会用到的几个可视化库。如果你还没有安装 Python，可以前往 Python 官网下载并安装。建议安装 Python 3.7 或以上版本。

安装可视化库非常简单，只需要使用 pip 命令即可。打开命令行或终端，输入以下命令：

pip install matplotlib seaborn plotly pandas

matplotlib：Python 中最基础、最常用的绘图库，功能强大，可以绘制各种静态图表。
seaborn：基于 Matplotlib 的高级可视化库，提供了更美观、更简洁的图表样式，并且更易于处理统计数据。
plotly：交互式可视化库，可以创建动态、可交互的图表，支持在线分享和展示。
pandas: 数据分析和处理库，为数据可视化提供数据来源和处理功能。

安装完成后，我们就可以开始编写代码了。

2. Matplotlib 入门：绘制基础图表

Matplotlib 是 Python 中最基础的可视化库，它提供了丰富的绘图功能，可以绘制各种类型的图表，例如折线图、散点图、柱状图、饼图等。接下来，我们将通过几个简单的例子，来学习如何使用 Matplotlib 绘制基础图表。

2.1 绘制折线图

折线图通常用于展示数据的趋势变化。下面是一个简单的例子，展示了如何使用 Matplotlib 绘制折线图：

 import matplotlib.pyplot as plt
 
# 定义 x 轴和 y 轴数据
x = [1, 2, 3, 4, 5]
y = [2, 4, 1, 3, 5]
 
# 绘制折线图
plt.plot(x, y)
 
# 添加标题和标签
plt.title('折线图示例')
plt.xlabel('x 轴')
plt.ylabel('y 轴')
 
# 显示图表
plt.show()

运行这段代码，你将会看到一个简单的折线图，横轴表示 x 轴数据，纵轴表示 y 轴数据。

2.2 绘制散点图

散点图用于展示两个变量之间的关系。下面是一个例子，展示了如何使用 Matplotlib 绘制散点图：

 import matplotlib.pyplot as plt
 
# 定义 x 轴和 y 轴数据
x = [1, 2, 3, 4, 5]
y = [2, 4, 1, 3, 5]
 
# 绘制散点图
plt.scatter(x, y)
 
# 添加标题和标签
plt.title('散点图示例')
plt.xlabel('x 轴')
plt.ylabel('y 轴')
 
# 显示图表
plt.show()

这段代码会生成一个散点图，每个点代表一个数据点，点的位置由 x 轴和 y 轴数据决定。

2.3 绘制柱状图

柱状图用于展示不同类别数据的比较。下面是一个例子，展示了如何使用 Matplotlib 绘制柱状图：

 import matplotlib.pyplot as plt
 
# 定义数据
categories = ['A', 'B', 'C', 'D']
values = [2, 4, 1, 3]
 
# 绘制柱状图
plt.bar(categories, values)
 
# 添加标题和标签
plt.title('柱状图示例')
plt.xlabel('类别')
plt.ylabel('数值')
 
# 显示图表
plt.show()

这段代码会生成一个柱状图，每个柱子代表一个类别，柱子的高度代表该类别对应的数值。

2.4 绘制饼图

饼图用于展示不同类别数据在整体中所占的比例。下面是一个例子，展示了如何使用 Matplotlib 绘制饼图：

 import matplotlib.pyplot as plt
 
# 定义数据
labels = ['A', 'B', 'C', 'D']
sizes = [30, 25, 15, 30]
 
# 绘制饼图
plt.pie(sizes, labels=labels, autopct='%1.1f%%')
 
# 添加标题
plt.title('饼图示例')
 
# 显示图表
plt.show()

这段代码会生成一个饼图，每个扇形代表一个类别，扇形的面积代表该类别在整体中所占的比例。

3. Seaborn 进阶：绘制更美观的图表

Seaborn 是一个基于 Matplotlib 的高级可视化库，它提供了更美观、更简洁的图表样式，并且更易于处理统计数据。 Seaborn 的设计目标是使数据可视化更加简单、直观。接下来，我们将通过几个例子，来学习如何使用 Seaborn 绘制更美观的图表。

3.1 绘制散点图（Seaborn）

 import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
 
# 创建一个示例 DataFrame
data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 1, 3, 5]}
df = pd.DataFrame(data)
 
# 绘制散点图
sns.scatterplot(x='x', y='y', data=df)
 
# 添加标题
plt.title('Seaborn 散点图示例')
 
# 显示图表
plt.show()

Seaborn 的 scatterplot 函数可以方便地绘制散点图，data 参数接受一个 Pandas DataFrame，x 和 y 参数分别指定 x 轴和 y 轴的列名。

3.2 绘制线性回归图（Seaborn）

线性回归图可以展示两个变量之间的线性关系，并拟合一条回归线。下面是一个例子：

 import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
 
# 创建一个示例 DataFrame
data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 1, 3, 5]}
df = pd.DataFrame(data)
 
# 绘制线性回归图
sns.regplot(x='x', y='y', data=df)
 
# 添加标题
plt.title('Seaborn 线性回归图示例')
 
# 显示图表
plt.show()

Seaborn 的 regplot 函数可以方便地绘制线性回归图，它会自动拟合一条回归线，并显示置信区间。

3.3 绘制箱线图（Seaborn）

箱线图可以展示数据的分布情况，包括中位数、四分位数、异常值等。下面是一个例子：

 import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
 
# 创建一个示例 DataFrame
data = {'类别': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'], '数值': [1, 2, 3, 4, 5, 6, 7, 8, 9]}
df = pd.DataFrame(data)
 
# 绘制箱线图
sns.boxplot(x='类别', y='数值', data=df)
 
# 添加标题
plt.title('Seaborn 箱线图示例')
 
# 显示图表
plt.show()

Seaborn 的 boxplot 函数可以方便地绘制箱线图，x 和 y 参数分别指定 x 轴和 y 轴的列名，data 参数接受一个 Pandas DataFrame。

3.4 绘制热力图（Seaborn）

热力图可以展示数据的相关性，颜色深浅代表相关程度。下面是一个例子：

 import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
 
# 创建一个示例 DataFrame
data = np.random.rand(10, 10) # 生成一个 10x10 的随机矩阵
df = pd.DataFrame(data)
 
# 绘制热力图
sns.heatmap(df, annot=True, cmap='YlGnBu')  # annot 显示数值，cmap 设置颜色
 
# 添加标题
plt.title('Seaborn 热力图示例')
 
# 显示图表
plt.show()

Seaborn 的 heatmap 函数可以方便地绘制热力图，data 参数接受一个 DataFrame 或矩阵，annot 参数可以显示数值，cmap 参数可以设置颜色映射。

4. Plotly 进阶：绘制交互式图表

Plotly 是一个交互式可视化库，可以创建动态、可交互的图表，支持在线分享和展示。 Plotly 的图表可以在浏览器中进行缩放、平移、悬停等操作，使数据探索更加便捷。接下来，我们将通过几个例子，来学习如何使用 Plotly 绘制交互式图表。

4.1 绘制折线图（Plotly）

 import plotly.express as px
import pandas as pd
 
# 创建一个示例 DataFrame
data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 1, 3, 5]}
df = pd.DataFrame(data)
 
# 绘制折线图
fig = px.line(df, x='x', y='y', title='Plotly 折线图示例')
 
# 显示图表
fig.show()

Plotly 的 px.line 函数可以方便地绘制折线图，x 和 y 参数分别指定 x 轴和 y 轴的列名，data 参数接受一个 Pandas DataFrame。运行这段代码，你将会看到一个可交互的折线图，你可以通过鼠标进行缩放、平移等操作。

4.2 绘制散点图（Plotly）

 import plotly.express as px
import pandas as pd
 
# 创建一个示例 DataFrame
data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 1, 3, 5], '类别': ['A', 'B', 'A', 'B', 'A']}
df = pd.DataFrame(data)
 
# 绘制散点图
fig = px.scatter(df, x='x', y='y', color='类别', title='Plotly 散点图示例')
 
# 显示图表
fig.show()

Plotly 的 px.scatter 函数可以方便地绘制散点图，x 和 y 参数分别指定 x 轴和 y 轴的列名，color 参数可以根据类别进行颜色区分，data 参数接受一个 Pandas DataFrame。运行这段代码，你将会看到一个可交互的散点图，你可以通过鼠标悬停查看数据点的信息。

4.3 绘制柱状图（Plotly）

 import plotly.express as px
import pandas as pd
 
# 创建一个示例 DataFrame
data = {'类别': ['A', 'B', 'C', 'D'], '数值': [2, 4, 1, 3]}
df = pd.DataFrame(data)
 
# 绘制柱状图
fig = px.bar(df, x='类别', y='数值', title='Plotly 柱状图示例')
 
# 显示图表
fig.show()

Plotly 的 px.bar 函数可以方便地绘制柱状图，x 和 y 参数分别指定 x 轴和 y 轴的列名，data 参数接受一个 Pandas DataFrame。运行这段代码，你将会看到一个可交互的柱状图，你可以通过鼠标悬停查看柱子的高度。

4.4 绘制饼图（Plotly）

 import plotly.express as px
import pandas as pd
 
# 创建一个示例 DataFrame
data = {'类别': ['A', 'B', 'C', 'D'], '数值': [30, 25, 15, 30]}
df = pd.DataFrame(data)
 
# 绘制饼图
fig = px.pie(df, names='类别', values='数值', title='Plotly 饼图示例')
 
# 显示图表
fig.show()

Plotly 的 px.pie 函数可以方便地绘制饼图，names 参数指定类别列名，values 参数指定数值列名，data 参数接受一个 Pandas DataFrame。运行这段代码，你将会看到一个可交互的饼图，你可以通过鼠标悬停查看扇形的比例。

5. Pandas 与数据可视化：数据处理与图表结合

Pandas 是 Python 中强大的数据分析库，它可以方便地进行数据清洗、转换、分析等操作。将 Pandas 与数据可视化库结合使用，可以更高效地完成数据分析和可视化任务。接下来，我们将通过几个例子，来学习如何将 Pandas 与 Matplotlib、Seaborn、Plotly 结合使用。

5.1 Pandas 与 Matplotlib

 import pandas as pd
import matplotlib.pyplot as plt
 
# 创建一个示例 DataFrame
data = {'日期': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05'],
        '销售额': [100, 120, 110, 130, 140]}
df = pd.DataFrame(data)
 
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
 
# 绘制折线图
plt.plot(df['日期'], df['销售额'])
 
# 添加标题和标签
plt.title('销售额趋势图')
plt.xlabel('日期')
plt.ylabel('销售额')
 
# 格式化 x 轴日期显示
plt.gcf().autofmt_xdate()
 
# 显示图表
plt.show()

在这个例子中，我们首先创建了一个包含日期和销售额的 DataFrame，然后使用 pd.to_datetime() 将日期列转换为日期类型，接着使用 Matplotlib 的 plot() 函数绘制折线图，横轴为日期，纵轴为销售额。 plt.gcf().autofmt_xdate() 用于格式化 x 轴日期显示，使日期标签更美观。

5.2 Pandas 与 Seaborn

 import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
 
# 创建一个示例 DataFrame
data = {'类别': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
        '数值': [1, 2, 3, 4, 5, 6, 7, 8, 9]}
df = pd.DataFrame(data)
 
# 绘制箱线图
sns.boxplot(x='类别', y='数值', data=df)
 
# 添加标题
plt.title('数值分布箱线图')
 
# 显示图表
plt.show()

在这个例子中，我们创建了一个包含类别和数值的 DataFrame，然后使用 Seaborn 的 boxplot() 函数绘制箱线图，横轴为类别，纵轴为数值。 Seaborn 的 boxplot() 函数可以直接接受 Pandas DataFrame 作为输入，非常方便。

5.3 Pandas 与 Plotly

 import pandas as pd
import plotly.express as px
 
# 创建一个示例 DataFrame
data = {'类别': ['A', 'B', 'C', 'D'], '数值': [30, 25, 15, 30]}
df = pd.DataFrame(data)
 
# 绘制饼图
fig = px.pie(df, names='类别', values='数值', title='各类别占比')
 
# 显示图表
fig.show()

在这个例子中，我们创建了一个包含类别和数值的 DataFrame，然后使用 Plotly 的 px.pie() 函数绘制饼图，names 参数指定类别列名，values 参数指定数值列名，data 参数接受一个 Pandas DataFrame。 Plotly 同样可以方便地与 Pandas 结合使用。

6. 数据可视化进阶技巧

6.1 图表美化

设置图表样式：Matplotlib、Seaborn 都提供了丰富的样式设置选项，例如修改颜色、线条样式、标记样式、字体大小等，可以通过调整这些参数来美化图表。 Seaborn 提供了多种内置的图表样式，可以通过 sns.set() 函数进行设置。
添加注释：在图表中添加注释可以帮助读者更好地理解数据。可以使用 Matplotlib 的 text() 和 annotate() 函数来添加文本注释和箭头注释。
调整坐标轴：调整坐标轴的范围、刻度、标签等可以使图表更清晰、更易读。可以使用 Matplotlib 的 xlim()、ylim()、xticks()、yticks() 函数来调整坐标轴。
添加图例：当图表中包含多个系列的数据时，需要添加图例来区分不同的系列。可以使用 Matplotlib 的 legend() 函数来添加图例。

6.2 多图表组合

子图：使用 Matplotlib 的 subplot() 或 subplots() 函数可以在一个画布上创建多个子图，并将不同的图表绘制在不同的子图上。这可以用于比较不同的数据，或者展示同一数据的不同视角。
多图层：可以使用 Matplotlib 的 twinx() 函数在同一张图上创建多个 Y 轴，从而绘制不同单位或不同量级的数据。

6.3 数据预处理与清洗

在进行数据可视化之前，通常需要对数据进行预处理和清洗，例如：

缺失值处理：处理缺失值的方法包括删除缺失值、填充缺失值（使用均值、中位数、众数等填充）、插值等。可以使用 Pandas 的 dropna()、fillna()、interpolate() 函数来处理缺失值。
异常值处理：异常值是指与大多数数据点差异较大的数据点。处理异常值的方法包括删除异常值、将异常值替换为合理的数值等。可以使用 Pandas 的条件筛选和替换功能来处理异常值。
数据类型转换：将数据转换为正确的类型，例如将字符串转换为数值、将字符串转换为日期等。可以使用 Pandas 的 astype() 和 to_datetime() 函数进行数据类型转换。
数据聚合与分组：对数据进行聚合和分组，例如计算平均值、求和、计数等。可以使用 Pandas 的 groupby() 和聚合函数（例如 mean()、sum()、count()）进行数据聚合和分组。

7. 案例实战：分析真实数据集

为了更好地理解数据可视化的应用，我们将通过一个真实的数据集进行案例实战。我们将使用 Kaggle 上的一个泰坦尼克号乘客生存预测数据集，来分析乘客的生存情况。

7.1 数据加载与预处理

 import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
 
# 加载数据集
train_data = pd.read_csv('train.csv')
test_data = pd.read_csv('test.csv')
 
# 查看数据集前几行
print(train_data.head())
 
# 查看数据集信息
print(train_data.info())
 
# 处理缺失值（以训练集为例）
# 'Age' 列用中位数填充
train_data['Age'].fillna(train_data['Age'].median(), inplace=True)
# 'Embarked' 列用众数填充
train_data['Embarked'].fillna(train_data['Embarked'].mode()[0], inplace=True)
 
# 删除 'Cabin' 列（缺失值太多）
train_data.drop('Cabin', axis=1, inplace=True)
 
# 查看处理后的数据集信息
print(train_data.info())

首先，我们加载了训练集和测试集，然后使用 head() 函数查看数据集的前几行，使用 info() 函数查看数据集的信息，包括缺失值的情况。接下来，我们对缺失值进行处理，使用中位数填充 Age 列，使用众数填充 Embarked 列，删除缺失值过多的 Cabin 列。最后，再次使用 info() 函数查看处理后的数据集信息，确认缺失值已处理完毕。

7.2 数据可视化分析

接下来，我们将使用数据可视化技术，对数据进行分析，探索影响乘客生存的关键因素。

7.2.1 生存人数统计

 # 绘制生存人数柱状图
sns.countplot(x='Survived', data=train_data)
plt.title('生存人数统计')
plt.xlabel('0: 未生存, 1: 已生存')
plt.ylabel('人数')
plt.show()

这段代码使用 countplot() 函数绘制了生存人数的柱状图，可以直观地看到未生存和已生存的人数。

7.2.2 不同性别生存率分析

 # 绘制不同性别生存率柱状图
sns.countplot(x='Sex', hue='Survived', data=train_data)
plt.title('不同性别生存率')
plt.xlabel('性别')
plt.ylabel('人数')
plt.legend(['未生存', '已生存'])
plt.show()

这段代码使用 countplot() 函数绘制了不同性别生存率的柱状图，hue 参数指定了根据生存情况进行分组，可以直观地看到不同性别在生存率上的差异。

7.2.3 不同船舱等级生存率分析

 # 绘制不同船舱等级生存率柱状图
sns.countplot(x='Pclass', hue='Survived', data=train_data)
plt.title('不同船舱等级生存率')
plt.xlabel('船舱等级')
plt.ylabel('人数')
plt.legend(['未生存', '已生存'])
plt.show()

这段代码使用 countplot() 函数绘制了不同船舱等级生存率的柱状图，可以直观地看到不同船舱等级在生存率上的差异。

7.2.4 年龄与生存关系分析

 # 绘制年龄与生存关系的箱线图
sns.boxplot(x='Survived', y='Age', data=train_data)
plt.title('年龄与生存关系')
plt.xlabel('0: 未生存, 1: 已生存')
plt.ylabel('年龄')
plt.show()

这段代码使用 boxplot() 函数绘制了年龄与生存关系的箱线图，可以观察不同生存状态下年龄的分布情况。

7.2.5 票价与生存关系分析

 # 绘制票价与生存关系的散点图
sns.scatterplot(x='Fare', y='Age', hue='Survived', data=train_data)
plt.title('票价与年龄的生存关系')
plt.xlabel('票价')
plt.ylabel('年龄')
plt.legend(['未生存', '已生存'])
plt.show()

这段代码使用 scatterplot() 函数绘制了票价与年龄的散点图，hue 参数指定了根据生存情况进行颜色区分，可以观察票价与年龄对生存的影响。

7.3 分析总结

通过以上的数据可视化分析，我们可以得出以下结论：

女性的生存率高于男性。
船舱等级越高，生存率越高。
年龄较小的人，生存率相对较高。
票价越高，生存率越高。

这些结论可以帮助我们更好地理解泰坦尼克号乘客的生存情况，为后续的预测建模提供依据。

8. 总结与展望

本文介绍了使用 Python 进行数据可视化的基础知识和实战技巧，包括 Matplotlib、Seaborn、Plotly 三个主要的可视化库的使用，以及如何结合 Pandas 进行数据处理和可视化分析。我们通过具体的代码示例和案例实战，让大家能够轻松上手，打造属于自己的炫酷图表。

数据可视化是一个不断发展和创新的领域。随着技术的不断进步，会出现更多更强大的可视化工具和技术。希望大家能够持续学习，不断提升自己的数据可视化能力，从而更好地理解数据，发现数据的价值。接下来，可以继续学习以下内容：

更高级的可视化库：例如 Bokeh、PyEcharts 等，这些库提供了更丰富、更灵活的可视化功能。
交互式可视化：学习如何创建更高级的交互式图表，例如动态图表、地图可视化等。
数据可视化设计原则：学习数据可视化的设计原则，例如颜色选择、图表布局、图表类型选择等，可以使你的图表更美观、更易读。
数据可视化在机器学习中的应用：学习如何将数据可视化应用于机器学习，例如特征工程、模型评估等。

希望本文能够帮助你开启数据可视化之旅，在数据分析的道路上越走越远！

码小喵 Python 数据可视化 Matplotlib

	import matplotlib.pyplot as plt

	# 定义 x 轴和 y 轴数据
	x = [1, 2, 3, 4, 5]
	y = [2, 4, 1, 3, 5]

	# 绘制折线图
	plt.plot(x, y)

	# 添加标题和标签
	plt.title('折线图示例')
	plt.xlabel('x 轴')
	plt.ylabel('y 轴')

	# 显示图表
	plt.show()

	import matplotlib.pyplot as plt

	# 定义数据
	categories = ['A', 'B', 'C', 'D']
	values = [2, 4, 1, 3]

	# 绘制柱状图
	plt.bar(categories, values)

	# 添加标题和标签
	plt.title('柱状图示例')
	plt.xlabel('类别')
	plt.ylabel('数值')

	# 显示图表
	plt.show()

	import matplotlib.pyplot as plt

	# 定义数据
	labels = ['A', 'B', 'C', 'D']
	sizes = [30, 25, 15, 30]

	# 绘制饼图
	plt.pie(sizes, labels=labels, autopct='%1.1f%%')

	# 添加标题
	plt.title('饼图示例')

	# 显示图表
	plt.show()

	import seaborn as sns
	import matplotlib.pyplot as plt
	import pandas as pd

	# 创建一个示例 DataFrame
	data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 1, 3, 5]}
	df = pd.DataFrame(data)

	# 绘制散点图
	sns.scatterplot(x='x', y='y', data=df)

	# 添加标题
	plt.title('Seaborn 散点图示例')

	# 显示图表
	plt.show()

	import plotly.express as px
	import pandas as pd

	# 创建一个示例 DataFrame
	data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 1, 3, 5]}
	df = pd.DataFrame(data)

	# 绘制折线图
	fig = px.line(df, x='x', y='y', title='Plotly 折线图示例')

	# 显示图表
	fig.show()

	# 绘制生存人数柱状图
	sns.countplot(x='Survived', data=train_data)
	plt.title('生存人数统计')
	plt.xlabel('0: 未生存, 1: 已生存')
	plt.ylabel('人数')
	plt.show()

	# 绘制不同性别生存率柱状图
	sns.countplot(x='Sex', hue='Survived', data=train_data)
	plt.title('不同性别生存率')
	plt.xlabel('性别')
	plt.ylabel('人数')
	plt.legend(['未生存', '已生存'])
	plt.show()

	# 绘制不同船舱等级生存率柱状图
	sns.countplot(x='Pclass', hue='Survived', data=train_data)
	plt.title('不同船舱等级生存率')
	plt.xlabel('船舱等级')
	plt.ylabel('人数')
	plt.legend(['未生存', '已生存'])
	plt.show()

	# 绘制年龄与生存关系的箱线图
	sns.boxplot(x='Survived', y='Age', data=train_data)
	plt.title('年龄与生存关系')
	plt.xlabel('0: 未生存, 1: 已生存')
	plt.ylabel('年龄')
	plt.show()

	# 绘制票价与生存关系的散点图
	sns.scatterplot(x='Fare', y='Age', hue='Survived', data=train_data)
	plt.title('票价与年龄的生存关系')
	plt.xlabel('票价')
	plt.ylabel('年龄')
	plt.legend(['未生存', '已生存'])
	plt.show()

Python 数据可视化实战：从入门到精通，手把手教你打造炫酷图表

1. 准备工作：安装 Python 和可视化库

2. Matplotlib 入门：绘制基础图表

2.1 绘制折线图

2.2 绘制散点图

2.3 绘制柱状图

2.4 绘制饼图

3. Seaborn 进阶：绘制更美观的图表

3.1 绘制散点图（Seaborn）

3.2 绘制线性回归图（Seaborn）

3.3 绘制箱线图（Seaborn）

3.4 绘制热力图（Seaborn）

4. Plotly 进阶：绘制交互式图表

4.1 绘制折线图（Plotly）

4.2 绘制散点图（Plotly）

4.3 绘制柱状图（Plotly）

4.4 绘制饼图（Plotly）

5. Pandas 与数据可视化：数据处理与图表结合

5.1 Pandas 与 Matplotlib

5.2 Pandas 与 Seaborn

5.3 Pandas 与 Plotly

6. 数据可视化进阶技巧

6.1 图表美化

6.2 多图表组合

6.3 数据预处理与清洗

7. 案例实战：分析真实数据集

7.1 数据加载与预处理

7.2 数据可视化分析

7.2.1 生存人数统计

7.2.2 不同性别生存率分析

7.2.3 不同船舱等级生存率分析

7.2.4 年龄与生存关系分析

7.2.5 票价与生存关系分析

7.3 分析总结

8. 总结与展望

1. 准备工作：安装 Python 和可视化库

2. Matplotlib 入门：绘制基础图表

2.1 绘制折线图

2.2 绘制散点图

2.3 绘制柱状图

2.4 绘制饼图

3. Seaborn 进阶：绘制更美观的图表

3.1 绘制散点图（Seaborn）

3.2 绘制线性回归图（Seaborn）

3.3 绘制箱线图（Seaborn）

3.4 绘制热力图（Seaborn）

4. Plotly 进阶：绘制交互式图表

4.1 绘制折线图（Plotly）

4.2 绘制散点图（Plotly）

4.3 绘制柱状图（Plotly）

4.4 绘制饼图（Plotly）

5. Pandas 与数据可视化：数据处理与图表结合

5.1 Pandas 与 Matplotlib

5.2 Pandas 与 Seaborn

5.3 Pandas 与 Plotly

6. 数据可视化进阶技巧

6.1 图表美化

6.2 多图表组合

6.3 数据预处理与清洗

7. 案例实战：分析真实数据集

7.1 数据加载与预处理

7.2 数据可视化分析

7.2.1 生存人数统计

7.2.2 不同性别生存率分析

7.2.3 不同船舱等级生存率分析

7.2.4 年龄与生存关系分析

7.2.5 票价与生存关系分析

7.3 分析总结

8. 总结与展望

评论点评