直玩小游戏、多线程、WebGPU:微信小游戏技术能力全面升级
文章目录
2026 年 5 月 27 日,曾老师在杭州参加了 2026 微信小游戏开发者大会。这是曾老师以媒体和开发者双重身份参会的第 3 年。
本篇是大会下午场分享实录,标题为:微信小游戏技术新能力
分享人为微信公开课讲师林育新。
更多分享:
- 上午场的完整分享: 50 万开发者,5 亿月活,千万流水:微信小游戏 9 年答卷
- 开发者分享: 《一箭又一箭》的组合创新心路历程:简单克制,一切有解
- 开发者分享: 上线 2 年仍日耗 40 万,《打个螺丝》从调优到长线运营的全流程分析
- 开发者分享: 500 个换卡群、528 万 MAU:《向往的生活》小游戏的长线打法
- 开发者分享: 从 20 年老 IP 到微信小游戏:《冒险岛》的加减法
- LayaAir 引擎分享: 微信小游戏进入 WebGPU 时代,LayaAir 怎么做技术升级?
今天的分享按照平台能力和工具能力两部分展开。
平台能力部分会重点介绍多线程能力、WebGPU、PC 超分、直玩小游戏。这些新能力能让游戏在运行性能、画面表现、设备适配和新场景触达上有更多发挥空间。
工具能力部分会着重介绍实时性能诊断工具、云测试能力升级,以及通用引擎适配方案。工具能力的升级,会帮助开发者更快发现和定位问题,并进一步降低游戏的接入和调优成本。
先从平台能力开始。
多线程能力:把主线程从高负载中释放出来
在小游戏运行过程中,很多任务默认集中运行在主线程上,比如用户输入、WebGL 渲染调用。当游戏场景复杂度上来之后,主线程的调度就很容易被打满。
通过鱼群渲染案例来看,在单线程模式下,逻辑和渲染任务都在主线程中运行。随着鱼群数量增加,游戏帧率也会受到影响。同样的鱼群场景下,开启多线程渲染能力之后,游戏帧率从原来的 40 帧提升到 52 帧,整体帧率提升了大约 30%。
多线程渲染的思路,是将渲染相关指令迁移到 Worker Runtime 中执行,主线程主要承担用户交互和游戏关键调度。但多线程要真正发挥收益,关键在于通信效率。如果主线程和 Worker 之间有频繁的大量数据拷贝,多线程能力带来的收益就会被通信成本抵消掉。
所以平台也在线程之间补齐了 SAB、Atomics、Transferable 等高速通信能力,能有效降低线程间的数据传输和同步成本。
我们知道,多线程渲染是多线程能力的一个应用场景。回到具体项目中,主线程的压力来自多个方面,比如资源解析、大量网络状态同步等等。所以平台针对这些场景也提供了一个更通用的 Worker 底座。
在这个底座当中,我们向开发者提供标准的 Web Worker 能力,并且在 Worker 中实现绝大部分微信 API。开发者可以根据自己游戏的性能评估,将游戏中一些高负载任务迁移到 Worker 中运行。
目前,多线程相关能力已经在头部小游戏中落地使用,比如《王者荣耀》等已经在相关场景使用到多线程能力。多线程是给小游戏提供更完整的并行执行能力,开发者可以基于这套底座,把主线程从高负载状态中释放出来,进一步提升游戏在复杂场景下的运行帧率和稳定性。
WebGPU:把复杂渲染和并行计算交给 GPU
多线程主要解决 CPU 侧的调度压力。接下来,WebGPU 更多关注 GPU 侧,特别是复杂渲染和高并行计算场景下的性能上限。
过去,小游戏主要基于 WebGL 管线实现渲染。WebGL 可以覆盖绝大多数游戏场景,但面对复杂 3D、大量粒子特效,以及模拟、剔除、图像处理这类 GPU 计算任务时,WebGL 的上限就比较明显。
WebGPU 带来的变化,是让小游戏获得更接近原生图形 API 的 GPU 能力。一方面,它可以降低 GPU 和 CPU 之间的调度成本;另一方面,它也提供了更现代化的图形管线,并支持 Compute Shader 等相关能力。这样我们就可以将大量并行计算任务放到 GPU 侧执行。
通过屏幕左侧的布料模拟测试案例来看,这是典型的高并行计算压力测试。根据平台测试数据,WebGPU 相比 WebGL,帧率提升大约 3.5 倍,帧耗时下降 90% 以上。
右边是一个实时草丛渲染场景。在这一类场景中,性能压力不仅来自草的数量,还来自每一帧都需要决定哪些草要展示、要怎么摆动,以及如何高效地成批绘制。借助 WebGPU 的能力,我们可以让 GPU 自己计算、自己筛选,并最终发起绘制,减少 CPU 参与,让大规模植被渲染更加稳定。
目前,WebGPU 处于内测阶段。如果有 WebGPU 相关诉求的团队,欢迎通过智能小助手与我们联系。
PC 超分:解决大屏画质发糊
小游戏在 PC 端运行时,有一个很典型的问题:很多资源最初是按照手机屏幕设计的,但到了 PC 大屏被放大之后,文字、UI 等很容易出现发糊、锯齿不清等问题。PC 超分要解决的,就是大屏场景下的游戏画质提升问题。
通过左侧测试案例来看,开启超分能力之后,游戏画质得到明显提升。文字和 UI 的边缘变得更加清晰,角色和道具轮廓更利落,开启超分之后游戏画质大约有 10% 的提升。PC 超分是一套在输出阶段进行的智能化算法和策略控制,最终通过用户设备的 GPU 对游戏画面做实时增强。
这套方案主要有三个特点。
第一,它是低侵入性的,游戏整体接入成本比较低,并不需要针对 PC 重新做高清资源。第二,它是实时增强,在输出阶段通过用户 GPU 完成画质提升。第三,超分策略可配置。不同 PC 设备的 GPU 性能不一样,所以平台可以根据 PC 设备性能、游戏画面类型,配置更合适的超分策略。
目前,PC 超分属于平台内测阶段。如果有诉求,可以联系我们评估接入。平台侧也会根据游戏画面类型、原本的性能表现以及目标设备情况,协助配置更合适的超分策略。
直玩小游戏:把游戏体验前置到广告阶段
前面讲的都是游戏运行后的性能和画质优化能力。我们把视角往前移,看用户进入游戏前的第一个体验:广告。
直玩小游戏解决的是投放链路转化长,以及广告制作成本高的问题。用户从看到广告到真正进入游戏,中间还需要经历跳转、下载等流程,链路越长,转化损耗越明显。
直玩能力上线以来,从平台整体效果来看,它对游戏转化提升还是比较明显的:CTCVR 提升大约 3 倍,并且注册 CPA 成本也降低了超过 80%。关键在于用户整个转化链路发生了改变,用户不再只是看到一个广告素材,而是从广告链路中直接进入真实游戏,把游戏体验前置到广告阶段。
虽然直玩能力能降低游戏广告素材制作成本,但这并不代表我们不需要针对直玩产品做对应优化。
从广告曝光到游戏可交互之间,仍然会经历代码包下载、框架启动、游戏初始化等环节。如果没有针对这些环节做优化,用户进来之后可能还没有玩到核心玩法就离开了。
所以在直玩场景下,开发者需要围绕游戏首体验做单独优化。比如,针对直玩场景设计直玩首关,让用户更快进入游戏核心玩法;并将直玩相关资源拆分为小游戏独立分包,在框架启动阶段就完成分包下载,减少用户等待下载的时间。最后再配合条件预载能力,针对直玩广告预载场景配置合适条件,就可以更早将直玩相关资源加载好,让用户更快进入游戏。
在这一系列优化做好之后,直玩场景下游戏可以更快进入可玩的状态,甚至做到秒开。通过屏幕右方案例可以看到,用户从点击激励广告之后,就能很快看到游戏画面,并迅速进入可交互状态。
我们知道,好友分享是小游戏获客的重要来源。上面针对直玩场景的优化,也可以用于好友分享。比如被分享用户通过分享卡片进入游戏之后,开发者可以复用直玩分包的相关优化,让被分享的好友直接进入游戏核心玩法,进一步提升分享场景下用户的转化和留存。
工具能力:把问题定位前移
完成平台能力接入之后,通常还需要知道游戏在真实设备上跑得怎么样,以及出现问题时怎么定位。接下来介绍工具能力相关升级。
首先是实时性能诊断工具。小游戏性能问题往往不是一条帧率或者内存曲线就能解释的。设备状态、引擎表现、平台能力调用以及业务事件,通常需要放在同一条链路中看。
过去开发者排查问题时,通常需要在日志、性能曲线、录屏之间来回切换。实时性能诊断工具会将整个链路中的数据采集起来,并做相关分析,最终通过 AI 分析能力,把游戏运行过程中的异常点、可能原因,以及对应优化建议结构化呈现出来。
这样,在性能波动中,开发者看到的不再只是曲线上的尖峰,而是可以回到具体设备、具体场景以及具体链路中进行性能分析。
未来,实时性能诊断工具会进一步开放到 AI 生态当中,包括提供对应的 Skill。它不仅可以作为本地单独使用的诊断工具,也可以成为 AI 工作流的能力节点,用来发起数据采集、报告读取、上下文关联、代码分析、资源配置排查等能力。
当前,实时性能诊断工具会提供 CLI 和 Service 两种能力。CLI 主要负责本地数据采集和基础诊断,Service 更多支持插件和自定义指标扩展。业务可以根据自己的需要,将游戏中的核心性能场景指标加入诊断链路,形成更贴合项目的诊断能力。
实时性能诊断工具是一套从采集、关联到建议的完整链路工具,它能帮助开发者更快回到链路中排查和定位。
云测试能力升级:多元测试、AI 分析和异常快照
实时性能诊断工具更多是帮助开发者在开发阶段采集性能问题,而云测试工具则是在游戏上线前提供多平台、多设备的测试能力,让问题在上线前先被测试体系拦截下来。
这次云测试能力升级,主要集中在三个方向:多元化测试、AI 分析和异常快照。
第一,多元化测试覆盖。平台会覆盖更多真实测试场景,比如支持开发版测试、热启动测试、Query 测试、指定设备测试等等。这对小游戏测试很关键,因为很多问题并不是在主流程中暴露出来的,而是需要在特定入口、特定参数、特定组合下才会出现。
第二,AI 智能分析。测试完成之后,平台不再只是给一份结果列表,而是针对测试报告、JSError 报错做聚合分析,识别其中潜在风险,并给出更明确的优化建议。
第三,异常快照。当测试过程中出现异常时,云测试工具会记录当时的异常画面、设备状态和一些关键上下文信息。后续定位问题时,就不再需要完全依靠日志反推问题现场。
通用引擎适配:用 CLI 降低跨平台接入成本
小游戏一直保持很开放的技术架构,希望让不同引擎、不同技术栈的游戏,都能以很低的成本接入小游戏生态。
过去,Cocos、Laya、Unity 这一类成熟引擎,已经和小游戏生态完成了比较深入的适配。现在,像 H5、WebGL、WASM/VM 引擎这类技术栈的项目,也在通过通用引擎适配方案接入小游戏生态。
这背后依赖平台能力和工具链的持续完善。通用适配方案把平台底层运行能力、工具、SDK 串成一套完整流程,覆盖工程转换、能力接入等主要环节。这样,开发者就不需要从 0 适配小游戏运行环境差异,可以将更多精力放在游戏内容和体验优化本身。
在实际接入时,通用 CLI 主要负责将 H5 和 WebGL 产物转化为小游戏工程,能力 SDK 则补齐平台能力适配。方案会将很多重复的底层适配工作标准化。
这两步解决的是先让游戏在小游戏平台跑起来的问题。但游戏要达到可上线状态,还需要结合游戏类型、资源结构,以及设备上的真实运行表现,继续做针对性优化。大家可以通过扫描二维码查看完整文档,结合自己的项目做接入评估。
- 文章ID:2875
- 原文作者:zrong(Jacky)
- 原文链接:https://blog.zengrong.net/post/wechat-minigame-new-tech-capabilities/
- 版权声明:本作品采用 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 进行许可,非商业转载请注明出处(原文作者,原文链接),商业转载请联系作者获得授权。