小米发布 MiMo-V2.5-TTS / ASR 语音大模型:通过自然语言调度声音表现 小米发布 MiMo-V2.5 系列语音大模型,TTS 模型可通过自然语言指令精细控制声音的情绪、语速和风格,甚至一句话就能创造新音色。ASR 模型则在复杂场景下识别性能领先,现已限时免费或开源。#小米... AI 新资讯行业资讯# MiMoV2.5# 小米# 语音大模型 1个月前2,574228
字节发布全双工语音大模型 Seeduplex,豆包打电话能边听边讲、交流更自然 相比于上一代半双工豆包端到端语音模型,Seeduplex 基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升。 AI 新资讯行业资讯# AI 电话# AI 语音# Seeduplex 2个月前2,043649