Wasm 线程安全指南：使用 SharedArrayBuffer 和 Atomics API 驾驭 JavaScript 多线程

2025/3/12 09:29:36 43 0 0 0

1. 为什么需要 Wasm 线程安全？

2. SharedArrayBuffer 和 Atomics API：线程安全的关键

2.1 SharedArrayBuffer：共享内存空间

2.2 Atomics：原子操作，线程同步的基石

3. 在 Wasm 中使用 SharedArrayBuffer 和 Atomics

3.1 Wasm 模块（C/C++）

3.2 JavaScript 代码

3.3 Web Worker 代码 (worker.js)

3.4 运行结果分析

4. 线程安全的其他考量

5. 实际应用场景和最佳实践

6. 总结

7. 延伸阅读

你好，开发者！

在当今快节奏的 Web 开发世界中，性能至关重要。WebAssembly（Wasm）以其接近原生的速度和高效的内存管理，成为了提升 Web 应用性能的强大工具。然而，当我们在 JavaScript 环境中运行 Wasm 模块，并涉及多线程时，如何确保线程安全就成为了一个必须认真对待的问题。

本文将深入探讨在 JavaScript 的多线程环境中，如何通过 SharedArrayBuffer 和 Atomics API 来实现 Wasm 线程安全。我们将从基础概念入手，逐步深入，结合代码示例，帮助你理解并掌握这一关键技术，让你在构建高性能、并发的 Web 应用时更加得心应手。

1. 为什么需要 Wasm 线程安全？

首先，让我们明确一下，为什么在 Wasm 中需要关注线程安全。

并发执行: Wasm 模块可以在多个线程中并发执行。这意味着多个线程可能会同时访问和修改相同的内存区域。如果没有适当的同步机制，就会出现数据竞争、死锁等问题，导致程序行为不可预测，甚至崩溃。
数据共享: Wasm 模块可能需要与 JavaScript 共享数据。如果 Wasm 模块中的线程与 JavaScript 线程同时访问和修改共享数据，同样需要进行同步，以确保数据一致性。
复杂计算: 在需要进行大量计算的场景下，例如图像处理、科学计算等，多线程可以显著提高性能。但与此同时，也增加了线程安全管理的复杂性。

2. SharedArrayBuffer 和 Atomics API：线程安全的关键

幸运的是，JavaScript 提供了 SharedArrayBuffer 和 Atomics 这两个强大的 API，为我们在多线程环境中实现 Wasm 线程安全提供了基础。

2.1 SharedArrayBuffer：共享内存空间

SharedArrayBuffer 允许我们在 JavaScript 的不同线程之间共享一块内存区域。这块内存可以被多个线程同时读取和写入，极大地提高了数据共享的效率。

创建 SharedArrayBuffer:

const sharedBuffer = new SharedArrayBuffer(1024); // 创建一个大小为 1024 字节的 SharedArrayBuffer

访问 SharedArrayBuffer:
我们可以使用 Int32Array、Float64Array 等 TypedArray 来访问 SharedArrayBuffer 中的数据。这些 TypedArray 提供了类型化的视图，方便我们操作不同类型的数据。
```
 const int32Array = new Int32Array(sharedBuffer);
int32Array[0] = 10; // 将第一个元素设置为 10
```

2.2 Atomics：原子操作，线程同步的基石

Atomics API 提供了一组原子操作，用于在共享内存中安全地进行读写操作。原子操作是不可中断的，可以确保多个线程同时访问同一内存位置时的数据一致性。

原子读写:
Atomics 提供了多种原子读写操作，例如 Atomics.load、Atomics.store、Atomics.add、Atomics.sub、Atomics.and、Atomics.or、Atomics.xor 等。这些操作可以确保对共享内存的读写操作是原子性的，避免数据竞争。

 // 原子地读取 sharedBuffer 中索引为 0 的值
const value = Atomics.load(int32Array, 0);
// 原子地将 sharedBuffer 中索引为 0 的值设置为 20
Atomics.store(int32Array, 0, 20);
// 原子地将 sharedBuffer 中索引为 0 的值加 5
Atomics.add(int32Array, 0, 5);

原子比较和交换 (CAS):
Atomics.compareExchange 允许我们原子地比较一个内存位置的值，如果与期望值匹配，则将其替换为新值。这是一种非常重要的同步原语，可以用于实现锁、信号量等高级同步机制。
```
 // 如果 sharedBuffer 中索引为 0 的值等于 25，则将其替换为 30
const oldValue = Atomics.compareExchange(int32Array, 0, 25, 30);
```
原子等待和唤醒:
Atomics.wait 和 Atomics.notify 用于线程间的同步。Atomics.wait 会使线程暂停执行，直到另一个线程通过 Atomics.notify 唤醒它。这可以用于实现条件变量等同步机制。
```
 // 如果 sharedBuffer 中索引为 0 的值等于 0，则等待
Atomics.wait(int32Array, 0, 0);
// 唤醒等待在 sharedBuffer 中索引为 0 的线程
Atomics.notify(int32Array, 0, 1);
```

3. 在 Wasm 中使用 SharedArrayBuffer 和 Atomics

现在，让我们看看如何在 Wasm 模块中使用 SharedArrayBuffer 和 Atomics。这里，我们以一个简单的例子来说明，这个例子展示了如何在 Wasm 模块中进行原子加法操作。

3.1 Wasm 模块（C/C++）

 #include <emscripten.h>
#include <atomic>
 
// 声明一个指向 SharedArrayBuffer 的指针
int32_t* shared_memory = nullptr;
 
// 初始化 shared_memory
extern "C" EMSCRIPTEN_KEEPALIVE void init_shared_memory(int32_t* buffer) {
  shared_memory = buffer;
}
 
// 原子加法操作
extern "C" EMSCRIPTEN_KEEPALIVE int32_t atomic_add(int32_t offset, int32_t value) {
  if (shared_memory == nullptr) {
    return -1; // 如果 shared_memory 未初始化，则返回错误
  }
  return std::atomic_fetch_add(shared_memory + offset, value);
}
 
// 获取 shared_memory 中指定位置的值
extern "C" EMSCRIPTEN_KEEPALIVE int32_t get_value(int32_t offset) {
  if (shared_memory == nullptr) {
    return -1; // 如果 shared_memory 未初始化，则返回错误
  }
  return shared_memory[offset];
}

代码解释:

我们使用 emscripten.h 来编译 Wasm 模块。emscripten 是一个流行的 C/C++ 到 WebAssembly 的编译器。
shared_memory 是一个指向 int32_t 的指针，用于指向 SharedArrayBuffer。
init_shared_memory 函数用于初始化 shared_memory，它接收一个指向 SharedArrayBuffer 的指针作为参数。注意，这个函数必须被 JavaScript 调用，才能完成初始化。
atomic_add 函数使用 std::atomic_fetch_add 进行原子加法操作。std::atomic_fetch_add 是 C++ 标准库中提供的原子操作，可以保证线程安全。
get_value 函数用于获取 shared_memory 中指定位置的值。

3.2 JavaScript 代码

 // 1. 创建 SharedArrayBuffer
const sharedBuffer = new SharedArrayBuffer(4 * 1024); // 4KB
const int32Array = new Int32Array(sharedBuffer);
 
// 2. 编译 Wasm 模块
WebAssembly.instantiateStreaming(
    fetch('atomic_add.wasm'), // 假设你已经编译了 C++ 代码并生成了 atomic_add.wasm 文件
    {
        env: {
            // 提供给 Wasm 模块使用的函数
            consoleLog: (arg) => console.log(arg)
        }
    }
)
    .then(results => {
        const wasmModule = results.instance;
        const exports = wasmModule.exports;
 
        // 3. 初始化 shared_memory
        exports.init_shared_memory(int32Array);
 
        // 4. 使用原子加法
        const offset = 0; // 共享内存的偏移量
        const valueToAdd = 10;
        const oldValue = exports.atomic_add(offset, valueToAdd);
        console.log(`旧值: ${oldValue}`);
        console.log(`新值: ${exports.get_value(offset)}`); // 输出结果，应该是 10
 
        // 5. 多线程测试（使用 Web Workers）
        const workerCount = 4;
        for (let i = 0; i < workerCount; i++) {
            const worker = new Worker('worker.js'); // 创建 worker
            worker.postMessage({ sharedBuffer, offset, valueToAdd }); // 将 SharedArrayBuffer 和其他参数传递给 worker
        }
    });

代码解释:

创建 SharedArrayBuffer: 我们创建了一个大小为 4KB 的 SharedArrayBuffer，并使用 Int32Array 视图来访问它。
编译 Wasm 模块: 使用 WebAssembly.instantiateStreaming 加载和编译 Wasm 模块。fetch('atomic_add.wasm') 用于获取编译好的 Wasm 文件。 { env: { consoleLog: (arg) => console.log(arg) } } 提供了 Wasm 模块中可能用到的 JavaScript 函数，例如打印日志。
初始化 shared_memory: 调用 Wasm 模块中的 init_shared_memory 函数，将 int32Array 传递给它，完成 shared_memory 的初始化。
使用原子加法: 调用 Wasm 模块中的 atomic_add 函数，进行原子加法操作。offset 指定了在 SharedArrayBuffer 中的偏移量，valueToAdd 指定了要加的值。 exports.get_value(offset) 用于获取修改后的值。
多线程测试: 为了验证线程安全，我们使用 Web Workers 来模拟多线程并发访问。每个 Worker 都会收到 SharedArrayBuffer 和操作参数。Worker 会并发地调用 atomic_add 函数。

3.3 Web Worker 代码 (worker.js)

 self.onmessage = (event) => {
    const { sharedBuffer, offset, valueToAdd } = event.data;
    const int32Array = new Int32Array(sharedBuffer);
    // 编译 Wasm 模块
    WebAssembly.instantiateStreaming(
        fetch('atomic_add.wasm'),
        {
            env: {
                consoleLog: (arg) => console.log(arg)
            }
        }
    )
        .then(results => {
            const wasmModule = results.instance;
            const exports = wasmModule.exports;
 
            // 初始化 shared_memory
            exports.init_shared_memory(int32Array);
 
            // 执行原子加法操作
            for (let i = 0; i < 1000; i++) {
                exports.atomic_add(offset, valueToAdd);
            }
            console.log(`Worker 完成，最终值为: ${exports.get_value(offset)}`);
        });
};

代码解释:

接收消息: Worker 接收主线程发送的消息，消息中包含了 SharedArrayBuffer 和操作参数。
编译 Wasm 模块: Worker 同样需要编译 Wasm 模块。
初始化 shared_memory: 初始化 shared_memory，指向接收到的 SharedArrayBuffer。
执行原子加法: 循环多次调用 atomic_add 函数，模拟并发操作。

3.4 运行结果分析

在浏览器中运行这段代码，并观察控制台输出。你会发现，即使有多个 Worker 并发地修改共享内存，最终的结果仍然是正确的。这是因为 atomic_add 函数使用了原子操作，保证了线程安全。

4. 线程安全的其他考量

除了 SharedArrayBuffer 和 Atomics 之外，还有一些其他的因素需要考虑，以确保 Wasm 模块的线程安全：

内存模型: 理解 Wasm 的内存模型，特别是线性内存和内存对齐，对于避免潜在的线程安全问题至关重要。
数据结构: 在多线程环境中，选择合适的数据结构非常重要。例如，使用线程安全的数据结构（如并发队列）可以简化线程同步。避免使用非线程安全的数据结构，例如直接修改全局变量。
锁和互斥量: 在更复杂的情况下，你可能需要使用锁和互斥量来保护共享资源。Wasm 可以通过与 JavaScript 交互，使用 JavaScript 提供的锁和互斥量，或者在 Wasm 中实现自己的锁和互斥量。
信号量和条件变量: 类似于锁，信号量和条件变量也是非常有用的同步原语，可以用于控制线程的访问顺序和协调线程间的操作。
避免死锁: 死锁是多线程编程中一个常见的问题。确保你的代码不会导致死锁，例如，避免循环等待锁的情况。
调试和测试: 线程安全问题的调试和测试非常困难。你需要使用专门的工具和技术来检测和修复线程安全问题。例如，可以使用静态分析工具、动态分析工具和并发测试工具。

5. 实际应用场景和最佳实践

SharedArrayBuffer 和 Atomics 在许多实际应用场景中都非常有用，尤其是在需要高性能和并发处理的场景中：

图像处理: 例如，可以在多个线程中并行处理图像的像素数据，加速图像处理的效率。
科学计算: 例如，可以使用多线程并行计算矩阵运算、物理模拟等，提高计算速度。
游戏开发: 例如，可以使用多线程来处理游戏逻辑、渲染、物理引擎等，提升游戏性能。
数据分析: 例如，可以使用多线程并行处理大规模数据集，加快数据分析的速度。
Web Worker 集成: 将 Wasm 与 Web Worker 结合使用，可以充分利用多核 CPU，提高 Web 应用的响应速度和流畅度。

最佳实践:

设计清晰的线程模型: 在开始编写多线程 Wasm 代码之前，应该设计清晰的线程模型。明确哪些数据需要在线程之间共享，以及如何进行同步。
最小化共享数据: 尽量减少共享数据的数量。如果可能，将数据进行分区，让每个线程负责处理自己的数据，减少线程间的竞争。
使用高层次的抽象: 尽量使用高层次的抽象，例如线程安全的数据结构，来简化线程同步。避免直接使用底层的同步原语，除非必要。
细粒度锁: 如果需要使用锁，应该使用细粒度的锁。例如，只锁定需要保护的数据，而不是锁定整个共享资源。
测试和性能分析: 对多线程 Wasm 代码进行充分的测试和性能分析。使用性能分析工具来查找性能瓶颈，并优化代码。

6. 总结

在本文中，我带你深入了解了如何在 JavaScript 的多线程环境中，通过 SharedArrayBuffer 和 Atomics API 来实现 Wasm 线程安全。我们学习了如何创建和使用 SharedArrayBuffer 来共享内存，以及如何使用 Atomics API 来进行原子操作，从而确保多线程环境下的数据一致性。我们还通过一个简单的 C++ 和 JavaScript 的例子，演示了如何在 Wasm 模块中使用 SharedArrayBuffer 和 Atomics 进行原子加法操作。

掌握这些技术，你就可以在 Web 开发中充分利用 Wasm 的强大性能，构建出高性能、并发的 Web 应用。记住，线程安全是一个复杂的问题，需要仔细考虑。在编写多线程 Wasm 代码时，请务必小心谨慎，并进行充分的测试。

希望这篇文章对你有所帮助！如果你有任何问题，欢迎随时提出。祝你编码愉快！

7. 延伸阅读

感谢你的阅读！

代码匠 WebAssembly SharedArrayBuffer Atomics 多线程线程安全

	const int32Array = new Int32Array(sharedBuffer);
	int32Array[0] = 10; // 将第一个元素设置为 10

	// 原子地读取 sharedBuffer 中索引为 0 的值
	const value = Atomics.load(int32Array, 0);
	// 原子地将 sharedBuffer 中索引为 0 的值设置为 20
	Atomics.store(int32Array, 0, 20);
	// 原子地将 sharedBuffer 中索引为 0 的值加 5
	Atomics.add(int32Array, 0, 5);

	// 如果 sharedBuffer 中索引为 0 的值等于 25，则将其替换为 30
	const oldValue = Atomics.compareExchange(int32Array, 0, 25, 30);

	// 如果 sharedBuffer 中索引为 0 的值等于 0，则等待
	Atomics.wait(int32Array, 0, 0);
	// 唤醒等待在 sharedBuffer 中索引为 0 的线程
	Atomics.notify(int32Array, 0, 1);

	#include <emscripten.h>
	#include <atomic>

	// 声明一个指向 SharedArrayBuffer 的指针
	int32_t* shared_memory = nullptr;

	// 初始化 shared_memory
	extern "C" EMSCRIPTEN_KEEPALIVE void init_shared_memory(int32_t* buffer) {
	shared_memory = buffer;
	}

	// 原子加法操作
	extern "C" EMSCRIPTEN_KEEPALIVE int32_t atomic_add(int32_t offset, int32_t value) {
	if (shared_memory == nullptr) {
	return -1; // 如果 shared_memory 未初始化，则返回错误
	}
	return std::atomic_fetch_add(shared_memory + offset, value);
	}

	// 获取 shared_memory 中指定位置的值
	extern "C" EMSCRIPTEN_KEEPALIVE int32_t get_value(int32_t offset) {
	if (shared_memory == nullptr) {
	return -1; // 如果 shared_memory 未初始化，则返回错误
	}
	return shared_memory[offset];
	}

	// 1. 创建 SharedArrayBuffer
	const sharedBuffer = new SharedArrayBuffer(4 * 1024); // 4KB
	const int32Array = new Int32Array(sharedBuffer);

	// 2. 编译 Wasm 模块
	WebAssembly.instantiateStreaming(
	fetch('atomic_add.wasm'), // 假设你已经编译了 C++ 代码并生成了 atomic_add.wasm 文件
	{
	env: {
	// 提供给 Wasm 模块使用的函数
	consoleLog: (arg) => console.log(arg)
	}
	}
	)
	.then(results => {
	const wasmModule = results.instance;
	const exports = wasmModule.exports;

	// 3. 初始化 shared_memory
	exports.init_shared_memory(int32Array);

	// 4. 使用原子加法
	const offset = 0; // 共享内存的偏移量
	const valueToAdd = 10;
	const oldValue = exports.atomic_add(offset, valueToAdd);
	console.log(`旧值: ${oldValue}`);
	console.log(`新值: ${exports.get_value(offset)}`); // 输出结果，应该是 10

	// 5. 多线程测试（使用 Web Workers）
	const workerCount = 4;
	for (let i = 0; i < workerCount; i++) {
	const worker = new Worker('worker.js'); // 创建 worker
	worker.postMessage({ sharedBuffer, offset, valueToAdd }); // 将 SharedArrayBuffer 和其他参数传递给 worker
	}
	});

	self.onmessage = (event) => {
	const { sharedBuffer, offset, valueToAdd } = event.data;
	const int32Array = new Int32Array(sharedBuffer);
	// 编译 Wasm 模块
	WebAssembly.instantiateStreaming(
	fetch('atomic_add.wasm'),
	{
	env: {
	consoleLog: (arg) => console.log(arg)
	}
	}
	)
	.then(results => {
	const wasmModule = results.instance;
	const exports = wasmModule.exports;

	// 初始化 shared_memory
	exports.init_shared_memory(int32Array);

	// 执行原子加法操作
	for (let i = 0; i < 1000; i++) {
	exports.atomic_add(offset, valueToAdd);
	}
	console.log(`Worker 完成，最终值为: ${exports.get_value(offset)}`);
	});
	};

Wasm 线程安全指南：使用 SharedArrayBuffer 和 Atomics API 驾驭 JavaScript 多线程

1. 为什么需要 Wasm 线程安全？

2. SharedArrayBuffer 和 Atomics API：线程安全的关键

2.1 SharedArrayBuffer：共享内存空间

2.2 Atomics：原子操作，线程同步的基石

3. 在 Wasm 中使用 SharedArrayBuffer 和 Atomics

3.1 Wasm 模块（C/C++）

3.2 JavaScript 代码

3.3 Web Worker 代码 (worker.js)

3.4 运行结果分析

4. 线程安全的其他考量

5. 实际应用场景和最佳实践

6. 总结

7. 延伸阅读

1. 为什么需要 Wasm 线程安全？

2. SharedArrayBuffer 和 Atomics API：线程安全的关键

2.1 SharedArrayBuffer：共享内存空间

2.2 Atomics：原子操作，线程同步的基石

3. 在 Wasm 中使用 SharedArrayBuffer 和 Atomics

3.1 Wasm 模块（C/C++）

3.2 JavaScript 代码

3.3 Web Worker 代码 (worker.js)

3.4 运行结果分析

4. 线程安全的其他考量

5. 实际应用场景和最佳实践

6. 总结

7. 延伸阅读

评论点评