语音大模型

共 2 篇文章

排序

发布更新浏览点赞

小米发布 MiMo-V2.5-TTS / ASR 语音大模型：通过自然语言调度声音表现

小米发布 MiMo-V2.5-TTS / ASR 语音大模型：通过自然语言调度声音表现

小米发布 MiMo-V2.5 系列语音大模型，TTS 模型可通过自然语言指令精细控制声音的情绪、语速和风格，甚至一句话就能创造新音色。ASR 模型则在复杂场景下识别性能领先，现已限时免费或开源。#小米...

AI 新资讯行业资讯 # MiMoV2.5 # 小米 # 语音大模型

3个月前

9,649228

字节发布全双工语音大模型 Seeduplex，豆包打电话能边听边讲、交流更自然

字节发布全双工语音大模型 Seeduplex，豆包打电话能边听边讲、交流更自然

相比于上一代半双工豆包端到端语音模型，Seeduplex 基于“边听边说”的全新框架设计，交互体验的自然感、顺畅度大幅提升。

AI 新资讯行业资讯 # AI 电话 # AI 语音 # Seeduplex

3个月前

3,358649

🤖