PostgreSQL VACUUM 机制演进：从串行到并行，索引扫描优化全解析

2025/3/8 10:11:02 50 0 0 0

1. 为什么要 VACUUM？

2. VACUUM 的基本操作

2.1. 简单的 VACUUM 命令

2.2. VACUUM 的自动执行

2.3. 手动 VACUUM 的场景

3. VACUUM 的演进：从串行到并行

3.1. 并行 VACUUM 的引入

3.2. 并行 VACUUM 的优势

3.3. 并行 VACUUM 的注意事项

4. 索引扫描优化

4.1. 索引扫描的类型

4.2. 索引扫描优化的优势

4.3. 索引扫描优化的发展

5. VACUUM FULL：慎用！

6. 监控和调优 VACUUM

6.1. 监控 VACUUM 的状态

6.2. 调优 VACUUM 的参数

7. 总结

你好，我是老码农。今天我们来聊聊 PostgreSQL 中一个非常重要的话题：VACUUM。这玩意儿对于数据库的性能和稳定性至关重要，特别是对于那些经常进行INSERT、UPDATE 和 DELETE 操作的数据库。我们会从基础开始，逐步深入到VACUUM机制的演进，特别是近年来引入的并行清理、索引扫描优化等新特性。如果你是 DBA 或者架构师，相信这篇文章会对你有所帮助。

1. 为什么要 VACUUM？

首先，我们来明确一下，VACUUM 到底是什么，它为什么这么重要？

在 PostgreSQL 中，当我们执行UPDATE 或 DELETE 操作时，并不会立即物理删除旧的数据版本。相反，它会标记这些旧版本为“dead tuples”（死亡元组）。这些“dead tuples”会占用磁盘空间，并且在查询时，PostgreSQL 还需要检查这些“dead tuples”是否符合查询条件，这会降低查询性能。

VACUUM 的主要作用就是：

回收空间： 清理表和索引中的“dead tuples”，释放被占用的磁盘空间，使其可以被重用。
维护事务 ID (XID) 状态： 防止事务 ID 回绕（transaction ID wraparound），这可能导致数据损坏。PostgreSQL 使用事务 ID 来跟踪数据库中的更改。事务 ID 是有限的，如果长时间不进行清理，事务 ID 可能会被耗尽，从而导致数据一致性问题。
更新统计信息： VACUUM 还可以更新表和索引的统计信息，这些统计信息被查询优化器用来生成更优的查询执行计划，从而提高查询性能。

2. VACUUM 的基本操作

2.1. 简单的 VACUUM 命令

最简单的VACUUM命令是：

VACUUM;

或者，如果你只想清理某个特定的表，可以使用：

VACUUM table_name;

默认情况下，VACUUM 会清理表，并更新统计信息。如果只想清理表而不更新统计信息，可以使用VACUUM ANALYZE;。

VACUUM ANALYZE table_name;

ANALYZE 命令会收集关于表中数据的统计信息，例如行数、每个列的平均值等。这些信息对查询优化器至关重要。

2.2. VACUUM 的自动执行

PostgreSQL 提供了自动VACUUM功能，这通常是推荐的做法。自动VACUUM进程会定期检查数据库中的表，并根据需要执行VACUUM操作。这个过程由后台的autovacuum daemon进程负责。

可以通过以下配置参数来控制自动VACUUM的行为：

autovacuum: 启用或禁用自动VACUUM。默认为 on。
autovacuum_max_workers: 可以并行运行的自动VACUUM工作进程的最大数量。默认为 3。
autovacuum_naptime: 自动VACUUM进程休眠的时间（秒）。默认为 1 分钟。
autovacuum_vacuum_threshold: 触发VACUUM的最小死亡元组数。默认为 50。
autovacuum_analyze_threshold: 触发ANALYZE的最小行数变化量。默认为表的行数的 10%（但至少 50 行）。
autovacuum_vacuum_scale_factor: 触发VACUUM的死亡元组数与表大小的比例。默认为 0.2 (20%)。
autovacuum_analyze_scale_factor: 触发ANALYZE的行数变化量与表大小的比例。默认为 0.1 (10%)。

这些参数可以在postgresql.conf文件中进行设置，也可以针对每个表进行单独配置。例如，可以使用以下语句为特定表设置自动VACUUM参数：

ALTER TABLE table_name SET (autovacuum_vacuum_threshold = 1000);

2.3. 手动 VACUUM 的场景

虽然自动VACUUM非常方便，但在某些情况下，你可能需要手动执行VACUUM：

高负载环境： 在数据频繁更新的环境中，自动VACUUM可能无法及时清理“dead tuples”，导致表膨胀。手动VACUUM可以更及时地回收空间。
大批量数据导入或删除： 在导入或删除大量数据后，手动VACUUM可以立即回收空间和更新统计信息，从而优化后续的查询性能。
解决事务 ID 回绕问题： 当事务 ID 接近回绕时，需要手动执行VACUUM来防止数据损坏。

3. VACUUM 的演进：从串行到并行

早期的 PostgreSQL 版本中，VACUUM操作是串行执行的，这意味着它一次只能处理一个表。这在大型数据库中可能会导致长时间的停机，影响数据库的可用性。

3.1. 并行 VACUUM 的引入

为了提高VACUUM的效率和减少停机时间，PostgreSQL 引入了并行VACUUM功能。并行VACUUM允许多个工作进程同时清理不同的表，从而大大缩短了整个VACUUM过程的时间。

从 PostgreSQL 9.0 版本开始，VACUUM 就已经支持并行处理，但是并行度是有限的，并且需要手动配置。通过设置autovacuum_max_workers参数，可以控制并行VACUUM工作进程的最大数量。

 -- 示例：设置 autovacuum_max_workers 为 5
ALTER SYSTEM SET autovacuum_max_workers = 5;

3.2. 并行 VACUUM 的优势

更短的清理时间： 并行处理大大缩短了清理时间，特别是在大型数据库中。
提高数据库可用性： 由于清理时间缩短，数据库的停机时间也相应减少，提高了数据库的可用性。
更好的资源利用： 并行VACUUM可以更好地利用多核 CPU 的优势，提高资源利用率。

3.3. 并行 VACUUM 的注意事项

资源消耗： 并行VACUUM会消耗更多的 CPU、I/O 和内存资源。需要根据服务器的硬件配置和数据库负载情况，合理配置autovacuum_max_workers参数。
锁竞争： 并行VACUUM可能会导致锁竞争，影响其他数据库操作的性能。需要监控数据库的锁情况，并根据需要调整VACUUM的调度和并行度。

4. 索引扫描优化

VACUUM 过程不仅要清理表中的“dead tuples”，还要清理索引中的“dead tuples”。索引是加速查询的重要手段，但索引也需要维护。索引中同样会存在“dead tuples”，这些“dead tuples”会降低索引的效率，导致查询性能下降。

4.1. 索引扫描的类型

PostgreSQL 中，VACUUM 对索引的处理主要有两种方式：

全表扫描： 这是最基本的方式，VACUUM 会扫描整个表和所有索引，清理“dead tuples”。
索引扫描优化： 在某些情况下，PostgreSQL 可以利用索引来加速VACUUM过程。例如，如果一个表只有一个索引，并且该索引包含表中所有列，那么VACUUM 可以只扫描索引，而不需要扫描整个表。

4.2. 索引扫描优化的优势

更快的清理速度： 索引扫描通常比全表扫描更快，因为索引的数据量通常比表的数据量小。
更少的 I/O： 索引扫描可以减少 I/O 操作，提高清理效率。
减少锁竞争： 索引扫描可以减少锁竞争，提高数据库的并发性能。

4.3. 索引扫描优化的发展

PostgreSQL 在索引扫描优化方面一直在不断改进。例如，PostgreSQL 9.0 版本引入了index-only scans，允许VACUUM仅扫描索引来清理数据，而不需要访问表。这在某些情况下可以显著提高VACUUM的效率。

5. VACUUM FULL：慎用！

除了普通的VACUUM命令，PostgreSQL 还提供了VACUUM FULL命令。VACUUM FULL会重建整个表，包括表数据和索引。这可以最大程度地回收空间，并优化表和索引的存储结构。

但是，VACUUM FULL是一个非常耗时的操作，并且会长时间锁定表，导致数据库不可用。因此，强烈建议避免在生产环境中使用VACUUM FULL。只有在特殊情况下，例如表严重膨胀、性能下降严重，并且可以接受长时间停机时，才考虑使用VACUUM FULL。

如果你真的需要整理表空间，可以考虑以下替代方案：

pg_repack 扩展： pg_repack是一个第三方工具，它可以重建表，而不会锁定表。它通过在后台创建一个新的表，然后将数据复制到新表中，最后将新表替换旧表来实现。pg_repack 可以在不中断数据库服务的情况下，完成表空间的整理工作。
表分区： 对于大型表，可以考虑使用表分区。表分区可以将一个大表分割成多个小表，每个小表可以独立进行VACUUM操作，从而提高VACUUM的效率。

6. 监控和调优 VACUUM

VACUUM 是一个非常重要的维护任务，需要定期监控和调优，以确保数据库的性能和稳定性。

6.1. 监控 VACUUM 的状态

可以使用以下方法监控VACUUM的状态：

查看日志： PostgreSQL 的日志会记录VACUUM操作的信息，包括开始时间、结束时间、处理的表、回收的空间等。通过查看日志，可以了解VACUUM的执行情况。
查询系统视图： PostgreSQL 提供了多个系统视图，可以查询VACUUM的状态。例如，pg_stat_all_tables视图可以显示每个表的统计信息，包括行数、死亡元组数、上次VACUUM时间和ANALYZE时间等。pg_stat_activity视图可以显示当前正在运行的进程，包括VACUUM进程。
使用第三方监控工具： 可以使用第三方监控工具，例如 Prometheus + Grafana，来监控VACUUM的状态。这些工具可以提供更直观的监控界面和更丰富的监控指标。

6.2. 调优 VACUUM 的参数

根据数据库的负载情况和硬件配置，可以调整以下VACUUM的参数，以优化VACUUM的性能：

autovacuum_max_workers： 根据 CPU 核心数和数据库负载情况，调整autovacuum_max_workers参数，控制并行VACUUM工作进程的最大数量。
autovacuum_vacuum_threshold 和 autovacuum_vacuum_scale_factor： 根据表的更新频率和大小，调整autovacuum_vacuum_threshold和autovacuum_vacuum_scale_factor参数，控制触发VACUUM的条件。
autovacuum_analyze_threshold 和 autovacuum_analyze_scale_factor： 根据表的更新频率和大小，调整autovacuum_analyze_threshold和autovacuum_analyze_scale_factor参数，控制触发ANALYZE的条件。
maintenance_work_mem： 调整maintenance_work_mem参数，控制VACUUM操作使用的内存大小。增加maintenance_work_mem可以加快VACUUM的速度，但也会消耗更多的内存资源。
effective_io_concurrency： 调整effective_io_concurrency参数，控制 PostgreSQL 认为可以并行执行的 I/O 操作的数量。调整此参数可以影响VACUUM的性能，特别是在 I/O 负载较高的环境中。

7. 总结

VACUUM 是 PostgreSQL 中一个非常重要的维护任务，它对于数据库的性能和稳定性至关重要。通过理解VACUUM 的机制、并行清理、索引扫描优化等新特性，并结合监控和调优，可以有效地管理 PostgreSQL 数据库，确保其高效运行。

希望这篇文章能够帮助你更好地理解和使用 PostgreSQL 中的VACUUM功能。如果你有任何问题或建议，欢迎在评论区留言。我们一起学习，一起进步！

关键要点回顾：

VACUUM 的主要作用是回收空间、维护事务 ID 状态和更新统计信息。
自动VACUUM是推荐的做法，可以通过配置参数来控制其行为。
并行VACUUM可以提高清理效率和减少停机时间。
索引扫描优化可以加速VACUUM过程，减少 I/O 和锁竞争。
VACUUM FULL 慎用！
定期监控和调优VACUUM，确保数据库的性能和稳定性。

老码农 PostgreSQL VACUUM 数据库优化

	-- 示例：设置 autovacuum_max_workers 为 5
	ALTER SYSTEM SET autovacuum_max_workers = 5;

PostgreSQL VACUUM 机制演进：从串行到并行，索引扫描优化全解析

1. 为什么要 VACUUM？

2. VACUUM 的基本操作

2.1. 简单的 VACUUM 命令

2.2. VACUUM 的自动执行

2.3. 手动 VACUUM 的场景

3. VACUUM 的演进：从串行到并行

3.1. 并行 VACUUM 的引入

3.2. 并行 VACUUM 的优势

3.3. 并行 VACUUM 的注意事项

4. 索引扫描优化

4.1. 索引扫描的类型

4.2. 索引扫描优化的优势

4.3. 索引扫描优化的发展

5. VACUUM FULL：慎用！

6. 监控和调优 VACUUM

6.1. 监控 VACUUM 的状态

6.2. 调优 VACUUM 的参数

7. 总结

1. 为什么要 VACUUM？

2. VACUUM 的基本操作

2.1. 简单的 VACUUM 命令

2.2. VACUUM 的自动执行

2.3. 手动 VACUUM 的场景

3. VACUUM 的演进：从串行到并行

3.1. 并行 VACUUM 的引入

3.2. 并行 VACUUM 的优势

3.3. 并行 VACUUM 的注意事项

4. 索引扫描优化

4.1. 索引扫描的类型

4.2. 索引扫描优化的优势

4.3. 索引扫描优化的发展

5. VACUUM FULL：慎用！

6. 监控和调优 VACUUM

6.1. 监控 VACUUM 的状态

6.2. 调优 VACUUM 的参数

7. 总结

评论点评