仅需3GB内存,在浏览器里本地跑顶级AI画图

AI 知识库11小时前发布
672 0 0
熊猫办公
如果你玩过本地 AI 图像生成(比如 Stable Diffusion 或早期的 FLUX),你一定懂那种痛:你要么得拥有一张昂贵的 N 卡,要么得忍受极其繁琐的环境配置。至于那些不想折腾的普通用户,只能乖乖去交 Midjourney 的包月费,还要忍受云端无处不在的“词汇审查”。但就在昨天(2026年5月26日),AI 圈出现了一个真正的破局者。一直死磕极端量化技术的 PrismML 团队,毫无预兆地发布了Bonsai Image 4B。简单来说,他们把一个原本需要 16GB 显存才能勉强跑起来的顶级画图大模型,直接压到了 3GB,并且能直接在你的网页浏览器里纯本地运行。不用显卡焦虑,不用懂 Python,甚至不用装软件。这可能是今年到目前为止,端侧 AI 领域最让人兴奋的突破。把“大象”塞进手机里Bonsai Image 4B 的底座,是我们都很熟悉的 FLUX.2 Klein 4B。原版模型的实力毋庸置疑,但它 15.97GB 的体积对移动端和轻薄本来说,实在是太重了。PrismML 这次发狠,直接推出了1-bit(二值)Ternary(三值)两个极致压缩版本。我们来看一组离谱的数据:●完整部署包(包含文本编码器和 VAE):被压缩到了仅 3.4 ~ 3.9 GB,体积缩小了 4 到 5 倍。●Transformer 核心部分:1-bit 版本仅仅只有0.93 GB(8.3倍压缩);即使是画质更好的 Ternary 版本,也才1.21 GB。体积缩水这么多,画质崩了吗?据官方测试和第一波开发者的反馈,它硬生生保留了原版模型88% 到 95%的生成质量。

仅需3GB内存,在浏览器里本地跑顶级AI画图

最杀手级的特性:浏览器 WebGPU 直出如果只是模型变小了,那顶多算个技术迭代。Bonsai Image 4B 真正掀桌子的地方在于它的部署方式。得益于前端圈大神 Xenova 团队贡献的自定义 WebGPU kernels,这个模型完全支持在浏览器里本地推理。这意味着什么?你只需要打开 Safari 或 Chrome,加载网页,等几分钟把模型缓存到本地(仅限首次)。接下来,你所有的提示词输入、图像生成,全部都在你的本地设备上计算。断网也能画,数据绝不上传,彻底告别隐私焦虑和云端排队。而且速度相当可观。官方给出的测试参考数据是:●在Mac M4 Pro上:生成一张 512×512 的图片,只需约6 秒。●在iPhone 17 Pro Max上:差不多9 秒就能出图。是的,你没看错,手机上也能跑,而且 PrismML 对苹果的 MLX 框架做了原生支持优化,Apple Silicon 设备的体验可以说是丝滑无比。硬核科普:他们是怎么做到的?如果你懂点技术,可能会好奇:平时我们用的模型都是 FP16(16位浮点数),强行压缩到 1-bit,模型不就成“智障”了吗?PrismML 并没有使用简单粗暴的传统量化。他们对权重表示进行了深度重构:1-bit 版本只用 -1 和 +1 来表示权重,Ternary 则多了个 0(-1, 0, +1)。为了防止模型“崩溃”,团队很聪明地保留了网络中极少部分的关键投影层(Projection Layers)使用 FP16 精度。这就好比给一栋极简构造的房子,保留了最坚固的钢筋承重墙。

仅需3GB内存,在浏览器里本地跑顶级AI画图

怎么第一时间体验?目前模型已经全面开源(Apache 2.0 协议,良心支持商用),普通用户和开发者都有把玩的途径:1. 零门槛网页版(强烈推荐)直接在浏览器访问 Hugging Face 上的 WebGPU Demo,打开即用:🔗https://huggingface.co/spaces/webml-community/bonsai-image-webgpu(注:首次打开需下载3GB左右的模型缓存,建议在 Wi-Fi 环境下进行)2. 手机端原生体验iPhone 用户可以直接去 App Store 免费下载官方刚上架的Bonsai Studio iOS App,原生应用的资源调用会比网页端更稳定。3. 开发者直达模型权重已在 Hugging Face 同步开源,想接入自己 App 或是做二次开发的同学可以直接去拉库了。写在最后从之前文本大模型的 Ternary Bonsai,到今天的 Image Bonsai,PrismML 的野心很明显:把原本集中在云端算力农场里的“超大智能”,压缩、打包,塞进每一个普通人的口袋里。以前我们觉得,本地生成高质量 AI 图片是硬核极客和土豪玩家的专属。但今天,门槛被彻底踩碎了。这不仅解决了个人用户的隐私和费用痛点,更给开发者们打开了一扇大门——未来几个月,我们很可能会看到一大批真正好用的、完全离线的图像处理 App 爆发。今晚不妨打开浏览器跑跑看。你用它生成的第一张图是什么?欢迎在评论区和大家交流。



关于作者
做一只爬的最久的乌龟,保持学习保持好奇,即使慢一点,遇到一点困难,只要最后能到达终点,又有什么关系呢。
毕竟人生没有白走的路,每一步都算数。
© 版权声明

相关文章