Wasm 动态链接深度解析：原理、实践与性能优化

2025/3/12 14:19:35 30 0 0 0

什么是 Wasm 动态链接？

为什么需要 Wasm 动态链接？

如何使用 Emscripten 开启 Wasm 动态链接？

示例：动态链接两个 C 模块

动态链接模块之间的依赖关系

动态链接对性能的影响

总结与展望

大家好，我是你们的 Wasm 技术向导“码农老司机”。今天咱们来聊聊 WebAssembly（Wasm）中一个比较高级但又非常实用的特性——动态链接。相信在座的各位对动态链接库（.so、.dll）都不陌生，Wasm 的动态链接和它们有异曲同工之妙，但又有些许不同。如果你已经对 Wasm 有了一定的了解，想进一步探索 Wasm 的模块化和性能优化，那么这篇文章绝对不容错过。

什么是 Wasm 动态链接？

在聊 Wasm 动态链接之前，咱们先简单回顾一下传统的动态链接。在传统的原生开发中，动态链接允许我们将代码编译成独立的模块（动态链接库），然后在运行时按需加载。这样做的好处显而易见：

减小可执行文件体积： 公共代码可以被多个程序共享，无需重复打包。
模块化开发： 不同的功能可以放在不同的模块中，方便开发和维护。
运行时更新： 可以在不重新编译整个程序的情况下，更新部分模块。

Wasm 的动态链接也具备这些优点，但它更进一步，带来了 Web 开发的新可能。想象一下，你可以将一个大型 Web 应用拆分成多个 Wasm 模块，按需加载，这不仅能显著减少首屏加载时间，还能提升用户体验。更酷的是，这些模块可以用不同的语言编写（C/C++、Rust 等），只要它们能编译成 Wasm。

为什么需要 Wasm 动态链接？

在 Wasm 的早期，所有的代码通常被编译成一个单独的 .wasm 文件。这种“单体”模式对于小型应用来说没问题，但随着应用规模的增长，问题就来了：

加载时间长： 即使只用到其中一小部分功能，也需要加载整个 .wasm 文件。
更新成本高： 即使只修改了一行代码，也需要重新下载整个 .wasm 文件。
代码复用难： 不同应用之间难以共享通用的 Wasm 代码。

动态链接正是为了解决这些问题而生的。它允许我们将 Wasm 代码拆分成多个模块，按需加载，动态链接，从而实现更高效、更灵活的 Web 应用开发。

如何使用 Emscripten 开启 Wasm 动态链接？

Emscripten 是一个强大的工具链，可以将 C/C++ 代码编译成 Wasm。它也提供了对 Wasm 动态链接的支持。要开启动态链接，我们需要用到几个关键的编译选项：

-s MAIN_MODULE=1 或 -s MAIN_MODULE=2： 将当前模块编译为主模块。MAIN_MODULE=1 表示主模块是静态链接的，而 MAIN_MODULE=2 表示主模块也是动态链接的。
-s SIDE_MODULE=1： 将当前模块编译为侧模块（动态链接库）。
-s DYNAMIC_EXECUTION=1: 允许动态执行代码(在 wasm-ld 层面, 这会生成一个特殊的 section 来允许 wasm-ld 处理动态链接)
--no-entry: 当编译侧模块时，不需要入口函数。

下面咱们通过一个简单的例子来演示如何使用 Emscripten 进行动态链接。

示例：动态链接两个 C 模块

假设我们有两个 C 文件：main.c 和 side.c。

side.c：

 #include <stdio.h>
 
int add(int a, int b) {
    printf("Adding in side module!\n");
    return a + b;
}

main.c：

 #include <stdio.h>
 
// 声明 side.c 中的函数
int add(int a, int b);
 
int main() {
    printf("Calling add from main module!\n");
    int result = add(2, 3);
    printf("Result: %d\n", result);
    return 0;
}

编译步骤：

编译 side.c 为侧模块：

emcc side.c -o side.wasm -s SIDE_MODULE=1 -s DYNAMIC_EXECUTION=1 --no-entry

编译 main.c 为主模块：
```
emcc main.c -o main.html -s MAIN_MODULE=1 -s DYNAMIC_EXECUTION=1 -s EXPORTED_FUNCTIONS="['_add']" -s EXPORTED_RUNTIME_METHODS="['ccall','cwrap']"
```
这里我们导出了 _add函数，这是因为 C 编译器会对函数名进行修改（name mangling），所以我们需要用 _add。
EXPORTED_RUNTIME_METHODS 选项用于导出 ccall 和 cwrap 函数，方便我们在 JavaScript 中调用 Wasm 函数。
在 HTML 中加载并链接模块：

Emscripten 会生成一个 main.js 文件，我们需要修改它来加载 side.wasm。

 var Module = {
  onRuntimeInitialized: function() {
      // 手动加载 side.wasm
      fetch('side.wasm')
          .then(response => response.arrayBuffer())
          .then(bytes => WebAssembly.instantiate(bytes, {}))
          .then(sideModule => {
            // 手动链接
            Module.add = sideModule.instance.exports.add;
            // 现在可以调用 add 函数了
          });
  },
};

这个例子演示了最基本的动态链接过程。在实际应用中，Emscripten 提供了更高级的 API 来简化动态链接，例如 dlopen、dlsym 等，用法和原生开发中的动态链接库类似。

动态链接模块之间的依赖关系

在实际项目中，动态链接模块之间往往存在复杂的依赖关系。例如，模块 A 可能依赖模块 B，模块 B 又可能依赖模块 C。Emscripten 提供了一套机制来处理这些依赖关系。

当编译一个侧模块时，Emscripten 会自动分析它所依赖的其他模块，并将这些依赖信息记录在 Wasm 文件的自定义段（custom section）中。当加载主模块时，Emscripten 会根据这些依赖信息自动加载并链接所需的侧模块。

你也可以通过 -s AUTO_LINK_LIBRARIES 编译选项让 Emscripten 自动帮你处理库的链接，这在你有很多依赖时非常方便。不过要注意，这可能会引入不必要的库。

动态链接对性能的影响

动态链接在带来诸多好处的同时，也可能会对性能产生一定的影响。主要体现在以下几个方面：

加载时间： 虽然动态链接可以减少初始加载时间，但加载多个模块仍然会产生一定的网络开销。特别是在网络状况不佳的情况下，这种开销可能会比较明显。
链接开销： 动态链接需要在运行时进行符号解析和地址重定位，这会产生一定的 CPU 开销。不过，对于大多数应用来说，这种开销通常是可以忽略不计的。
代码优化： 动态链接可能会影响编译器的优化效果。因为编译器在编译每个模块时，无法看到其他模块的代码，因此无法进行跨模块的优化。

为了减轻动态链接对性能的影响，我们可以采取一些优化措施：

模块合并： 将一些经常一起使用的模块合并成一个较大的模块，减少模块数量。
延迟加载： 只在需要时才加载模块，避免不必要的加载。
预加载： 对于一些关键模块，可以提前预加载，减少用户等待时间。
代码拆分： 使用 Webpack 等工具进行代码拆分，将 Wasm 模块和 JavaScript 代码一起打包，减少 HTTP 请求。
使用 HTTP/2 或 HTTP/3： 利用多路复用等特性，减少网络延迟。

总结与展望

总的来说，Wasm 动态链接是一项非常强大的特性，它为 Web 开发带来了更多的可能性。通过动态链接，我们可以构建更大型、更复杂、更高效的 Web 应用。虽然动态链接也存在一些性能上的挑战，但只要我们合理使用，并采取适当的优化措施，就能充分发挥它的优势。

未来，Wasm 的动态链接还将继续发展。例如，WebAssembly Interface Types 提案将允许不同语言编写的 Wasm 模块之间更方便地进行交互，这将进一步推动 Wasm 的模块化和生态发展。让我们拭目以待！

如果你对 Wasm 动态链接还有其他疑问，或者在使用过程中遇到了什么问题，欢迎在评论区留言，我会尽力解答。如果你觉得这篇文章对你有帮助，别忘了点赞、分享，让更多的人了解 Wasm 动态链接的魅力！

码农老司机 WebAssembly 动态链接 Emscripten

	#include <stdio.h>

	int add(int a, int b) {
	printf("Adding in side module!\n");
	return a + b;
	}

	#include <stdio.h>

	// 声明 side.c 中的函数
	int add(int a, int b);

	int main() {
	printf("Calling add from main module!\n");
	int result = add(2, 3);
	printf("Result: %d\n", result);
	return 0;
	}

	var Module = {
	onRuntimeInitialized: function() {
	// 手动加载 side.wasm
	fetch('side.wasm')
	.then(response => response.arrayBuffer())
	.then(bytes => WebAssembly.instantiate(bytes, {}))
	.then(sideModule => {
	// 手动链接
	Module.add = sideModule.instance.exports.add;
	// 现在可以调用 add 函数了
	});
	},
	};

Wasm 动态链接深度解析：原理、实践与性能优化

什么是 Wasm 动态链接？

为什么需要 Wasm 动态链接？

如何使用 Emscripten 开启 Wasm 动态链接？

示例：动态链接两个 C 模块

动态链接模块之间的依赖关系

动态链接对性能的影响

总结与展望

什么是 Wasm 动态链接？

为什么需要 Wasm 动态链接？

如何使用 Emscripten 开启 Wasm 动态链接？

示例：动态链接两个 C 模块

动态链接模块之间的依赖关系

动态链接对性能的影响

总结与展望

评论点评