全网首测,TRAE SOLO 的 AI 麦克风!(附码)

AI 知识库1天前发布
723 0 0
熊猫办公
这是苍何的第 526 篇原创!大家好,我是苍何。我最近玩了好多 AI 硬件啊,甚至有一种癫狂的地步。我的好朋友 TRAE 最近又送了个好玩的东西给我,它叫影石 Insta360Mic Air。

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

这是 TRAE 和 Insta 360(影石)联名的麦克风,我跟你说句实话,我收到打开的时候光被这个颜值,我就爱不释手了。先来个题外话,TRAE 的产品设计真的是顶级的审美,我那天在 X 随便发了个帖子,一堆人却看上了 TRAE 送我的键盘

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

讲真的,你们现在看我能打字 BB 这么久,多多少少有键盘的一份功劳,我是个颜值控。不过说实话,自从体验了 Mic Air 的语音输入之后,键盘用的频率明显少了,毕竟动嘴比动手快太多了。跑偏了,实际使用下来,其实更兴奋,所以,我必须抽时间,录了好多个视频,好好给你分享我的喜悦,以及我所看到的一点思考。

另外我非常推荐你阅读完这一篇文章,因为文末会有方式给大家送 SOLO 邀请码。

先说说为什么是影石。影石 Insta360 在运动相机和全景相机领域,懂的都懂,音频采集这块本身就是他们的强项。

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

而 Mic Air 的参数也确实对得起这个联名,48kHz 采样率加上 24bit 位深,说人话就是,你哪怕小声嘀咕,它也能听得一清二楚。再加上 AI 降噪,在咖啡厅这种嘈杂环境下,也能把你的声音精准拎出来。7.9g,硬币大小,往衣领上一夹,基本就忘了它的存在。

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

说白了,TRAE 选影石合作,就是因为语音输入这件事,收音质量直接决定了指令识别的准确率。麦克风不行,后面的 AI 再强也白搭。我主要想给大家演示一下他的 AI 能力,以及和 TRAE SOLO 这款产品的丝滑融合。上来,我先录个视频给大家介绍下 Mic Air ,我就不露脸了,毕竟我要给你们看的是麦克风而不是我帅气的脸。

你看到了吗?我对着 Mic Air 一顿口喷,说了一堆废话,它自动帮我做了口语清洗,去除了语气词(嗯、然后、那个)、去除了重复词。我先打开的是他的 MTC 模式,也就是 More Than Coding 了,主要是 SOLO 处理办公任务。我让它去搜集全网关于 DeepSeek V4 相关的信息,但是一时语塞说了一些嗯、啊、那个这样的废话。Mic Air 最终自动去除了这些,做了精简转化,聚焦于核心。

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

我甚至直接丢给了它 DeepSeek 刚发布的关于 V4 的技术论文,让 SOLO 来翻译总结。搭配 Mic Air 后,指令更加精准了,这个出来的效果也直接符合。

好,现在有了相关的调研以及技术论文,我希望让 SOLO 去帮我基于刚才了解到的信息和总结的技术论文,去帮我写一篇技术文章。

我的做法是直接对着我衣领的麦克风口喷,这一刻,我仿佛自己是个 CEO,SOLO 仿佛是我的 AI 员工。只不过,加了 Mic Air 这个神级翻译,AI 员工 SOLO 也更好的理解需求,做好交付了。这是没经过处理的结果:

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

这是 Mic Air 经过 AI 处理后的结果,言简意赅,没有半句废话,可以说是个非常精准的指令了。

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

你会发现它能够进行「语义理解与自动修正」,主动识别我的语音,并自我修正(”不是…是…”),自动保留最终结论,删除被推翻的信息。不一会儿,SOLO 就帮我生成好了文章:

但说实话,没有配图的文章,显得确实有点太过于技术和枯燥了叭。于是继续打开语音模式,让它改。

说句实在的,要是把这个语音直接发给 SOLO,占用无效的输入 token 不说,完全是非结构化的指令。

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

使用 Mic Air 语音输入,在 SOLO 中能自动将这些转为结构化的文字。

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

这点还是非常重要的,特别是在写代码的时候,经常会有多处需要修改,有结构化表达能很好的让 AI 理解需求,减少误解。然后你就可以看到 SOLO 自己去生成文章配图,帮我把这篇文章算是彻底写好了。

然后我继续在 SOLO 中口喷,让它帮我把我当前文件夹进行分类整理。

说话的口语化还是比较多,不过没关系,SOLO 这边都直接做好了转换,并把文件分类好了。除了办公类任务,SOLO 还可以进行 Code,这也是它的老本行了。今天就来体验下,用嘴编程。我直接让 SOLO 来迭代我最新的开源项目 gpt-image-2.

视频你也看到了,一开始我哔哩啪啦说了一堆需求:

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

你看,它自动帮我总结出了就一句话:

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

这里还有个细节,「通过自然语音表达,SOLO 语音可以模糊匹配产品功能,一句话完成多步操作」。比如,我让它帮我提交到 GitHub 的时候,他能直接唤起 GitHub CLI 这个技能:

全网首测,TRAE SOLO 的 AI 麦克风!(附码)

我试了下,它也能支持 /plan、/skill 等,可用自然语言触发(比如”用 plan 模式”)我发现,当我飙了一句英文,它还能自动识别中英混合。性能方面,一下子口喷个好几分钟都没啥问题,而且不会中断。因为 SOLO 实际上是有 web 端的,配合这个语音输入,真的可以做到一边散步一边写代码了。说真的,体验完这一圈下来,让我兴奋的倒不是「语音写代码多牛」,是一种交互方式正在发生变化。我们从命令行敲代码,到 IDE 写代码,到 Copilot 补代码,再到现在用嘴说代码。每一次变化,本质上都是在缩短「你脑子里想的东西」到「它变成现实」之间的距离。以前你得先想清楚,再组织语言,再打字,再检查。现在你只需要像跟同事吹水一样说出来,AI 负责把你的废话变成精准指令。我觉得 Voice working 真正的价值在于,它降低了表达的门槛。你不需要措辞完美,不需要打字快,甚至说错了改口都没关系,AI 帮你兜底。

而且我大胆预测下,Voice working 会是接下来一两年最值得关注的趋势之一。

写代码只是开始,往后写文档、做调研、整理文件、安排日程,所有跟 AI 协作的场景都会被语音重构一遍。谁先在用户心里把「用嘴干活」这件事的心智抢下来,谁就拿到了下一个时代的入场券。而 TRAE SOLO + Mic Air 这套组合,已经率先踩在这条线上了。

也许再过几年回头看,我们会觉得「用手敲键盘写代码」这件事,就像现在回头看「用纸带打孔编程」一样古老。

谁知道呢。对了,这次给大家争取到了一些 SOLO 的邀请码,有兴趣体验的可以在后台发送私信:trae牛逼。我的 TRAE 朋友悄悄告诉我说,他们马上还要放个大招:上线实时问答互动 Real-time AI Interaction就是能和 AI 语音讨论,实时转录,就像GPT实时语音一样。我还是非常期待的。如果你已经在用 TRAE SOLO 了,也欢迎评论区聊聊你的体验,特别想知道,你们会习惯用嘴写代码吗?

© 版权声明

相关文章