ESP32-S31 全新性能喵伴升级实测

近期,乐鑫正式发布了全新一代芯片 ESP32-S31。相比前代产品 ESP32-S3,该芯片不仅在底层计算性能上实现了大幅跃升,更在硬件外设与通信接口上集成了多项关键优化。本文将以 AI 硬件 “喵伴” 的主控升级为例,详细解析 ESP32-S31 的技术提升和应用表现。


蓝牙音频

ESP32-S31 新增了对 BLE Audio 及经典蓝牙协议的全面支持,使终端设备具备了标准蓝牙音箱的直连音频播放能力。


蓝牙音箱.gif


此外,基于 LE Audio 的广播特性,ESP32-S31 能够支持多设备同步接收单一广播源并独立解码左右声道,同时设备自身亦可配置为音频广播发射节点,适用于多节点音频同步播放场景。


LE Audio.gif



更强的性能

ESP32-S31 最直接的提升就是它的性能,主频从 240MHz 提高到了 320MHz,而且底层架构切换到了 RISC-V。如果看 CoreMark 跑分,整体性能相比 S3 提升了大约 65%。

主频的提升,让很多传统视觉算法运行得更加流畅。比如运行 OpenCV 做颜色识别时,整体响应速度也会明显更快。


opencv颜色识别.gif


但 ESP32-S31 的提升,并不只是“跑分更高”这么简单。它的很多硬件更新可以直接影响实际的项目体验。


图像采集

基于 ESP32-S3 的喵伴,因为 IO 数量限制,所以没法再接入一个 DVP 摄像头。ESP32-S31 将可用 GPIO 数量扩充至 60 个,增加 DVP 摄像头后,还能额外空出 7 个可用 IO。


摄像头.gif


ESP32-S31 内置了硬件 JPEG 编解码模块。在摄像头完成图像采集后,ESP32-S31 可直接通过硬件进行 JPEG 编码压缩,结合其原生支持的 Wi-Fi 6 通信协议,设备能够以极低的延迟进行视频推流。


视频推流.gif


AI 视觉

在端侧 AI 推理方面, ESP32-S31 集成了 AI 指令集加速,并将 PSRAM 接口带宽从 ESP32-S3 的 80 MHz 大幅提升至 250 MHz。更快的数据吞吐速度,让本地模型推理速度有了明显的提升。


手势识别.gif


在本地运行 yolo11n 去识别物体时,ESP32-S31 的推理速度会有显著提升。


yolo11.gif


刷屏能力

在图像处理方面,ESP32-S31 硬件上增加了 jpeg 编解码,不仅速度更快,还能明显降低 CPU 占用。


s31喵伴刷屏.gif


ESP32-S31 支持了更高色深的 RGB888 格式,颜色还原更真实。我们直接对比 RGB565 格式的颜色渐变可以看出明显的区别。


RGB颜色格式对比.gif


ESP32-S31 最高的刷屏分辨率达到了 720P (HD),适合高分辨率 UI 显示。


720p屏幕 (1).gif


而且 ESP32-S31 硬件上还加入了像素处理加速器 (PPA) 和 2D-DMA 模块。简单来说就是有了专门的图形硬件去做数据搬运,像是旋转、缩放、镜像、颜色格式转换这些操作都可以硬件加速。


图形硬件加速.gif


这里摄像头画面可以快速实时缩放,就是因为有了 PPA。


PPA缩放摄像头画面.gif


在画面旋转的场景下,CPU 很容易被占满从而导致帧率明显下降。而 ESP32-S31 因为有硬件加速,所以即使开启画面旋转,整体也能维持相对较高的流畅度。


画面旋转性能对比.gif