Node.js 多线程避坑指南：死锁、竞态、内存泄漏，你踩过几个？

2025/3/10 11:19:40 49 0 0 0

一、Node.js 多线程基础：worker_threads

1.1 创建 Worker

1.2 worker.js (worker 线程)

1.3 通信方式

二、常见陷阱及解决方案

2.1 死锁 (Deadlock)

2.2 竞态条件 (Race Condition)

2.3 内存泄漏 (Memory Leak)

三、最佳实践

四、总结

大家好，我是你们的“填坑”老司机 – 码农老王。

Node.js 不是单线程的吗？没错，在 worker_threads 模块出现之前，Node.js 的确是单线程的。但随着 Node.js 的发展，为了更好地利用多核 CPU，worker_threads 模块应运而生，让 Node.js 也能玩转多线程了！

但是！多线程编程可不是闹着玩的，稍不留神，就会掉进各种坑里。今天老王就来给大家盘点一下 Node.js 多线程编程中常见的陷阱，并分享一些“填坑”经验，让你少走弯路，高效编程！

一、Node.js 多线程基础：worker_threads

在深入陷阱之前，咱们先来简单回顾一下 Node.js 多线程的基础——worker_threads 模块。

worker_threads 模块允许我们创建新的 JavaScript 执行线程。每个 worker 都有自己独立的 V8 引擎实例和事件循环。这意味着 worker 之间是真正并行的，可以充分利用多核 CPU 的计算能力。

1.1 创建 Worker

 const { Worker } = require('worker_threads');
 
const worker = new Worker('./worker.js', {
  workerData: { data: 'Hello from main thread!' }
});
 
worker.on('message', (message) => {
  console.log('Received message from worker:', message);
});
 
worker.on('error', (err) => {
  console.error('Worker error:', err);
});
 
worker.on('exit', (code) => {
  console.log(`Worker exited with code ${code}`);
});

1.2 worker.js (worker 线程)

 const { parentPort, workerData } = require('worker_threads');
 
console.log('Worker received data:', workerData);
 
parentPort.postMessage('Hello from worker thread!');

1.3 通信方式

主线程和 worker 线程之间可以通过 postMessage 方法进行通信，传递的数据会被复制（structured clone algorithm），而不是共享。这意味着修改一方的数据不会影响另一方。

二、常见陷阱及解决方案

了解了基础知识后，咱们就来重点聊聊那些让人头疼的陷阱吧！

2.1 死锁 (Deadlock)

场景还原： 多个线程互相等待对方释放资源，导致所有线程都无法继续执行。

Node.js 中的死锁： 虽然 Node.js 的 worker_threads 使用消息传递进行通信，看似避免了传统多线程编程中的资源竞争问题，但死锁依然可能发生。例如，如果主线程和 worker 线程互相等待对方发送消息，就会导致死锁。

代码示例 (模拟死锁)：

主线程 (main.js):

 const { Worker } = require('worker_threads');
 
const worker = new Worker('./worker.js');
 
worker.postMessage('Give me data!'); // 主线程先发送消息
 
worker.on('message', (message) => {
    console.log('Main thread received:',message);
    // 假设这里需要等待 worker 处理完数据后再发送其他消息
    worker.postMessage('OK, process complete!');
});

worker 线程 (worker.js):

 const { parentPort } = require('worker_threads');
 
parentPort.on('message', (message) => {
  console.log('worker thread received:', message);
  // Worker 线程先等待主线程的消息，然后再发送
  parentPort.postMessage('Data processed!');
});

分析： 上述代码中，主线程先发送消息给 worker 线程，然后等待 worker 线程的回复。而 worker 线程则先等待主线程的消息，然后再发送回复。这样，双方都在等待对方先发送消息，就形成了死锁。

解决方案：

避免循环等待： 设计良好的通信协议，避免主线程和 worker 线程互相等待对方的消息。可以考虑使用异步操作、Promise 等方式来解耦。
超时机制： 为 postMessage 或其他等待操作设置超时时间，避免无限期等待。
死锁检测工具： 虽然 Node.js 没有内置的死锁检测工具，但可以借助一些第三方工具或自行实现简单的检测机制 (例如，记录线程的等待状态和时间)。

2.2 竞态条件 (Race Condition)

场景还原： 多个线程访问和修改共享数据，由于执行顺序的不确定性，导致最终结果不可预测。

Node.js 中的竞态条件： 虽然 worker_threads 通过复制数据来避免直接的共享内存访问，但如果多个线程同时向同一个资源（如文件、数据库）写入数据，或者依赖于外部状态（如时间），仍然可能出现竞态条件。

代码示例 (模拟竞态)：

 // 假设有一个共享的计数器文件 counter.txt，初始值为 0
const { Worker } = require('worker_threads');
const fs = require('fs');
 
for (let i = 0; i < 5; i++) {
  new Worker('./increment.js');
}
 
// increment.js
const { parentPort } = require('worker_threads');
const fs = require('fs');
 
fs.readFile('counter.txt', 'utf8', (err, data) => {
  if (err) throw err;
  let count = parseInt(data);
  count++;
  fs.writeFile('counter.txt', count.toString(), (err) => {
    if (err) throw err;
    parentPort.postMessage('Incremented!');
  });
});

分析： 多个 worker 线程同时读取 counter.txt 文件，然后各自加 1，再写回文件。由于读取、加 1、写入这三个操作不是原子性的，多个线程之间可能交错执行，导致最终的计数结果小于预期值（例如，应该是 5，但实际可能是 2 或 3）。

解决方案：

原子操作： 对于简单的计数器，可以使用 Atomics 对象提供的原子操作（如 Atomics.add）来保证操作的原子性。但注意, Atomics 需要配合 SharedArrayBuffer 使用，这又回到了共享内存, 需要小心处理。
文件锁： 对于文件操作，可以使用文件锁（如 fs-ext 模块的 flock）来确保同一时间只有一个线程可以访问文件。
数据库事务： 对于数据库操作，使用事务来保证数据的一致性。
消息队列： 将对共享资源的访问请求放入消息队列中，由一个专门的 worker 线程来处理，避免多个线程同时访问。
集中管理状态: 将状态集中到主线程进行管理，worker线程只负责计算，将计算结果返回给主线程，由主线程更新状态。

2.3 内存泄漏 (Memory Leak)

场景还原： 程序中分配的内存没有被正确释放，导致可用内存越来越少，最终可能导致程序崩溃。

Node.js 中的内存泄漏： Node.js 的垃圾回收机制会自动回收不再使用的内存。但是，如果代码中存在循环引用、全局变量持有大量数据、未关闭的资源（如文件句柄、数据库连接）等情况，就会导致内存泄漏。

在多线程环境中，内存泄漏问题可能会更加复杂，因为每个 worker 都有自己的内存空间，而且 worker 之间的通信也会涉及内存分配和复制。

常见原因：

未正确关闭 Worker： 如果创建了 worker 但没有正确调用 worker.terminate() 来终止它，worker 线程会一直运行，导致内存无法释放。
事件监听器未移除： 如果在 worker 线程中注册了事件监听器，但没有在 worker 终止前移除它们，这些监听器会阻止 worker 被垃圾回收。
大量数据的复制： 在主线程和 worker 线程之间频繁传递大量数据，会导致大量的内存复制操作，增加内存负担，也可能导致内存碎片。
workerData的滥用: 将大量不需要的数据通过workerData传递给worker线程。
循环引用: 主线程和worker线程之间相互引用, 导致GC无法回收。

解决方案：

及时终止 Worker： 在不需要 worker 时，务必调用 worker.terminate() 来终止它。
移除事件监听器： 在 worker 终止前，移除所有注册的事件监听器。
使用 transferList： 对于 ArrayBuffer 等可转移对象，可以使用 postMessage 的 transferList 参数来转移对象的所有权，避免内存复制。
限制传递的数据量： 尽量减少在主线程和 worker 线程之间传递的数据量，只传递必要的数据。
内存分析工具： 使用 Node.js 的 heapdump 模块或 Chrome DevTools 的 Memory 面板来分析内存使用情况，找出内存泄漏的原因。
代码审查： 定期进行代码审查，检查是否存在可能导致内存泄漏的代码。
避免在workerData中传递大对象: 尽量只传递worker线程必需的数据。
WeakRef 和 FinalizationRegistry (Node.js v14.6+): 对于一些需要稍后清理的资源, 可以使用WeakRef 和 FinalizationRegistry 在对象被垃圾回收时执行清理操作。

三、最佳实践

除了避开上述陷阱外，还有一些最佳实践可以帮助你更好地编写 Node.js 多线程程序：

明确 Worker 的职责： 每个 worker 应该只负责一项具体的任务，避免 worker 过于庞大和复杂。
控制 Worker 的数量： 不要创建过多的 worker，过多的 worker 会导致线程切换开销增加，反而降低性能。通常，worker 的数量不应超过 CPU 核心数。
错误处理： 在主线程和 worker 线程中都要做好错误处理，避免一个 worker 的错误导致整个程序崩溃。
监控 Worker 的状态： 定期监控 worker 的状态（如 CPU 使用率、内存使用率），及时发现和解决问题。
使用线程池： 对于需要频繁创建和销毁 worker 的场景，可以使用线程池来复用 worker，减少创建和销毁 worker 的开销。 (可以使用第三方库，如 piscina)。
避免共享可变状态: 尽量通过消息传递数据，避免共享可变状态。
测试，测试，再测试！: 多线程程序很容易出现各种意想不到的问题，所以一定要进行充分的测试，包括单元测试、集成测试、压力测试等。

四、总结

Node.js 的多线程编程为我们提供了更强大的计算能力，但也带来了更多的挑战。通过了解常见的陷阱和最佳实践，我们可以编写出更高效、更稳定的 Node.js 多线程程序。

希望老王的这篇“填坑”指南能帮助到你！如果你还有其他关于 Node.js 多线程编程的问题，欢迎在评论区留言，老王会尽力解答。

记住，多线程编程就像走钢丝，小心驶得万年船！

码农老王 Node.js 多线程 worker_threads

	const { Worker } = require('worker_threads');

	const worker = new Worker('./worker.js', {
	workerData: { data: 'Hello from main thread!' }
	});

	worker.on('message', (message) => {
	console.log('Received message from worker:', message);
	});

	worker.on('error', (err) => {
	console.error('Worker error:', err);
	});

	worker.on('exit', (code) => {
	console.log(`Worker exited with code ${code}`);
	});

	const { parentPort, workerData } = require('worker_threads');

	console.log('Worker received data:', workerData);

	parentPort.postMessage('Hello from worker thread!');

	const { Worker } = require('worker_threads');

	const worker = new Worker('./worker.js');

	worker.postMessage('Give me data!'); // 主线程先发送消息

	worker.on('message', (message) => {
	console.log('Main thread received:',message);
	// 假设这里需要等待 worker 处理完数据后再发送其他消息
	worker.postMessage('OK, process complete!');
	});

	const { parentPort } = require('worker_threads');

	parentPort.on('message', (message) => {
	console.log('worker thread received:', message);
	// Worker 线程先等待主线程的消息，然后再发送
	parentPort.postMessage('Data processed!');
	});

	// 假设有一个共享的计数器文件 counter.txt，初始值为 0
	const { Worker } = require('worker_threads');
	const fs = require('fs');

	for (let i = 0; i < 5; i++) {
	new Worker('./increment.js');
	}

	// increment.js
	const { parentPort } = require('worker_threads');
	const fs = require('fs');

	fs.readFile('counter.txt', 'utf8', (err, data) => {
	if (err) throw err;
	let count = parseInt(data);
	count++;
	fs.writeFile('counter.txt', count.toString(), (err) => {
	if (err) throw err;
	parentPort.postMessage('Incremented!');
	});
	});

Node.js 多线程避坑指南：死锁、竞态、内存泄漏，你踩过几个？

一、Node.js 多线程基础：worker_threads

1.1 创建 Worker

1.2 worker.js (worker 线程)

1.3 通信方式

二、常见陷阱及解决方案

2.1 死锁 (Deadlock)

2.2 竞态条件 (Race Condition)

2.3 内存泄漏 (Memory Leak)

三、最佳实践

四、总结

一、Node.js 多线程基础：worker_threads

1.1 创建 Worker

1.2 worker.js (worker 线程)

1.3 通信方式

二、常见陷阱及解决方案

2.1 死锁 (Deadlock)

2.2 竞态条件 (Race Condition)

2.3 内存泄漏 (Memory Leak)

三、最佳实践

四、总结

评论点评