Wasm/WASI 的本质区别与宿主运行时生命周期认识

摘要：在构建基于 WebAssembly (Wasm) 的插件系统时，我们常被“编译一次，到处运行”的口号误导。实战证明，当我们将 Kotlin/Wasm 编译的模块嵌入到 C 语言宿主 (WasmEdge) 时，会遭遇一系列从“链接失败”到“运行时崩溃”的挑战。

本文将从架构视角复盘这一调试路径，揭示 Wasm 生态中 指令集 (Instruction Set) 与 系统接口 (System Interface) 的本质区别，并总结宿主运行时必须承担的初始化责任。

1. 核心概念重构：大脑与神经的博弈

在解决具体报错之前，我们需要重构对 Wasm 和 WASI 的认知。这两者往往被混为一谈，却是导致集成失败的根源。

1.1 Wasm：被切断感官的大脑 (The Brain)

WebAssembly (Wasm) 定义的是一种计算标准。它规定了代码如何被翻译成二进制指令（堆栈操作、算术运算、内存读写）。

本质：一个纯粹的计算引擎。
局限：它像一个被切断了感官的大脑，拥有极高的智商，但没有嘴巴（无法打印），没有耳朵（无法读取输入），也没有手（无法操作文件）。

1.2 WASI：标准化的神经接口 (The Interface)

WASI (WebAssembly System Interface) 是一套标准化的神经接口协议。它填补了 Wasm 与外界交互的空白。

本质：操作系统能力的抽象层。
功能：定义了如 fd_write (输出)、clock_time_get (时间)、random_get (随机数) 等标准接口。

🗝️ 核心洞察

Wasm 决定了怎么算（计算逻辑）。

WASI 决定了怎么交互（I/O 能力）。

2. 第一关：编译目标的契约失配

2.1 🚨 问题现象

在使用 Kotlin 编写 Wasm 插件时，初次尝试选择了 wasmJs 编译目标，代码中仅包含简单的 println。C 语言宿主加载该 .wasm 文件时，报错如下：

1	[error] instantiation failed: unknown import, module: "js_code", function: "kotlin.captureStackTrace"

2.2 🔍 深度分析：高级语言的“环境陷阱”

这是典型的宿主与客体契约不匹配 (Contract Mismatch)。当通过高级语言（如 Kotlin, Go, Python）编写 Wasm 产物时，我们必须明确知晓该产物所依赖的上下文环境。

Guest (Kotlin wasmJs) 的假设：编译器默认宿主环境是 浏览器 或 Node.js。因此，它生成了对 js_code 模块的强依赖，试图调用 JavaScript 的对象（如 console, Error.stack）。
Host (C/WasmEdge) 的现实：宿主是一个 Native 程序，它只实现了标准的 WASI 接口，根本不存在 JavaScript 虚拟机环境。

这就是“环境依赖地狱”：高级语言为了方便开发者，往往默认绑定了 Web 环境。但这对于 Server-side Wasm 来说是致命的——宿主 Runtime 无法提供这些特定的 JS 绑定。

2.3 ✅ 解决方案

必须选择统一的标准：WASI。

我们将 Kotlin 的编译目标切换为 wasmWasi。这不仅仅是改个参数，而是做出了一个架构决策：拒绝特定环境（JS）的依赖，拥抱通用标准。

错误路径：依赖 wasmJs -> 宿主必须嵌入 V8 引擎或模拟 JS 接口 -> 系统极其臃肿且难以维护。
正确路径：依赖 wasmWasi -> 宿主仅需实现 WASI 标准接口 -> 系统轻量、解耦且跨平台。

3. 第二关：运行时生命周期的陷阱

解决了导入依赖后，模块可以加载了。但在执行具体的 add 函数时，控制台抛出了更隐蔽的错误：

1	[error] execution failed: uncaught exception

3.1 🕳️ 陷阱一：被忽略的 `_initialize` (启动引导)

Kotlin（以及 Go、Java 等托管语言）编译为 Wasm 后，不再是简单的函数集合。在运行任何业务逻辑之前，必须先初始化运行时环境。

原因：Wasm 内部需要分配堆内存、启动垃圾回收器（GC）、初始化全局变量。
对策：在 Reactor 模式（即作为库被调用）下，宿主必须在调用业务函数前，显式调用 Guest 导出的 _initialize 函数。

如果跳过这一步，就像试图在没有安装操作系统的电脑上运行 Word，直接导致空指针引用或内存错误。

3.2 🕳️ 陷阱二：WASI 的 I/O 绑定 (感官连接)

最令人困惑的是：明明宿主代码中已经注册了 WASI 支持 (WasmEdge_HostRegistration_Wasi)，为什么调用 println 还会崩溃？

原因在于：注册 (Registration) ≠ 初始化 (Initialization)。

注册：只是告诉 VM “我有能力处理 WASI 请求”（我装了声卡驱动）。
初始化：是将宿主的实际资源（如当前的 Stdout 文件描述符）绑定到 Wasm 实例的过程（把音响线插到了声卡上）。

对策：在 C 宿主代码中，必须显式调用 WasmEdge_ModuleInstanceInitWASI。如果省略此步，Wasm 内部的 fd_write(1, ...) 调用会因为找不到对应的输出通道而失败，Kotlin 运行时捕获到这个 I/O 错误后，抛出了未捕获异常。

4. 架构总结：Wasm 插件系统的“守恒定律”

通过这次调试，我们可以总结出一套通用的 Wasm 插件系统设计原则。核心在于：Guest 的环境诉求必须由 Host 的能力集完全覆盖。

层面	关键要素	职责描述
Guest (插件)	上下文感知	开发者必须明确产物的依赖环境： ❌ Kotlin/Wasm (JS)：依赖 JS 胶水代码，不适合纯 Native 宿主。 ✅ Kotlin/Wasm (WASI)：仅依赖标准系统接口，完美适配 WasmEdge/WAMR 等宿主。 ⚪ Freestanding：零依赖，仅适合纯算法逻辑。
Host (宿主)	能力注入	Host 必须满足 Guest 列出的“需求清单 (Imports)”： 🔸 对应 `wasmWasi`，Host 必须注册并初始化 WASI 模块。 🔸 对应 GC/Exception 等高级特性，Host 必须开启 VM 的 Proposal 开关。
Runtime (运行时)	生命周期	连接 Guest 与 Host 的桥梁： 🔄 引导：负责调用 `_initialize` 建立内存秩序。 🔌 连接：负责绑定 I/O 管道，打通 Guest 与 Host 的感官。

5. 结语与参考资源

在 C/C++ 环境下嵌入 Wasm，不仅仅是加载一个二进制文件那么简单。它实质上是在构建一个微型的操作系统。

作为宿主开发者，你需要：

审视依赖：确保 Wasm 产物没有引入宿主不支持的“环境噪音”（如 JS 绑定）。
提供接口：为 Guest 准备标准的文件系统接口 (WASI)。
管理生命周期：为 Guest 分配内存空间 (_initialize) 并正确绑定 IO。

从 wasmJs 到 wasmWasi 的切换，不仅仅是编译参数的改变，更是从 “Web 前端依赖” 思维向 “云原生标准接口” 思维的根本转变。只有基于 WASI 这种统一标准，宿主 Runtime 才能在不感知上层语言（Kotlin/Rust/Go）差异的情况下，提供稳定的运行支撑。

🔗 相关 Runtime 与工具参考

以下是一些主流的支持 WASI 标准的 Runtime 及相关工具，它们均可作为上述架构中的“宿主 Runtime”选型参考：

WasmEdge Runtime: 高性能、轻量级的 WebAssembly 运行时，对 WASI 及扩展提案支持完善。
- https://github.com/WasmEdge/WasmEdge/
WAMR (WebAssembly Micro Runtime): 专为嵌入式和物联网设计的轻量级运行时（链接为 Windows 移植版参考）。
- https://github.com/moecly/wasm-micro-runtime-main-windows
Wazero Bridge (JVM): 如果宿主本身是 JVM 环境，wazero 是一个纯 Go 实现的 Runtime，这里的 bridge 项目展示了 Kotlin/JVM 如何与 Wasm 交互。
- https://github.com/crowforkotlin/wazero-bride-jvm