阿里千问发布全模态大模型 Qwen3.5-Omni，无缝理解文本、图片、音频及音视频输入

3 月 30 日消息，阿里千问今晚发布全模态大模型 Qwen3.5-Omni。

IT之家附核心亮点如下：

无缝理解文本、图片、音频及音视频输入，支持细粒度、带时间戳的音视频 Caption 生成；
215 项 SOTA 霸榜，在音频及音视频分析、推理、对话、翻译等任务超过 Gemini3.1-Pro；
自然涌现的 Audio-Visual Vibe Coding 能力；
支持语义打断、音色克隆及语音控制，让对话体验更自然；
支持 256K 超长上下文与 113 种语言识别，可处理 10 小时音频或 1 小时视频。
原生支持 WebSearch 和复杂 Function Call，不仅能聊天，更能帮你做事。

视频创作与剪辑

上传一段视频，Qwen3.5-Omni-Plus 能够遵循指令生成细粒度，结构化，带时间戳的准确 Caption：画面里是谁、说了什么话、背景音乐从哪一秒开始变化、镜头切了几次、每一帧发生了什么…… 还能帮你判断这段视频有没有敏感内容，将长视频变成可搜索的结构化笔记。

根据音视频指令，生成网页内容

根据你的要求，Qwen3.5-Omni 能直接生成可运行的代码。这也是本次我们最惊喜的发现：未进行专门训练，模型自然涌现出了 Vibe Coding 能力。它可以根据画面逻辑生成 Python 代码或前端原型…… 让创意验证从“看”到“做”只需一步。

更像真人的实时对话

和 Qwen3.5-Omni 聊天，更像是在跟真人交流。它懂得倾听的分寸：咳嗽声或随口附和不会让它误停下来，但你的真正插话它能瞬间接住。你还能指令它“小声点”、“用开心的语气”，像人一样自由控制声音的大小、语速与情绪，让对话体验更自然。

专属音色克隆

上传一段你的录音，就能定制专属的 AI Assistant 音色。克隆后的声音自然度高、稳定性强，支持多种语言生成。你可以打造一个“数字分身”式助手，让它用你的声音去沟通、去陪伴，让交互更具个性化。

智能任务执行

不止是聊天，Qwen3.5-Omni 还能帮你办事。询问“明天北京天气如何，推荐一家酒店”，它能自主判断是否需要联网搜索，调用工具查询实时信息并给出完整建议…… 原生支持 WebSearch 和复杂工具调用，让模型真正成为你的执行助手。

相比上一代，Qwen3.5-Omni 在长上下文、多语言、音视频理解能力上都有明显提升，同时新增了语义打断、音色克隆、语音控制等实时交互能力，让对话体验更接近真人。配合 ARIA 技术，语音输出的稳定性和自然度也进一步改善。

阿里千问发布全模态大模型 Qwen3.5-Omni，无缝理解文本、图片、音频及音视频输入 width=”1280″ height=”1325″>

Qwen3.5-Omni-Plus 在音频 / 音视频的理解、推理和交互任务上，共取得 215 项 SOTA 成绩，涵盖音视频、音频、语音识别、语音翻译等多个方向。

其中，通用音频理解、推理、识别、翻译、对话全面超越 Gemini-3.1 Pro，音视频理解能力总体达到 Gemini-3.1 Pro 水平。同时，视觉和文本能力与同尺寸 Qwen3.5 模型持平。

阿里千问发布全模态大模型 Qwen3.5-Omni，无缝理解文本、图片、音频及音视频输入 width=”1440″ height=”392″>

▲ Audio-Visual（音视频）

阿里千问发布全模态大模型 Qwen3.5-Omni，无缝理解文本、图片、音频及音视频输入 width=”1080″ height=”821″>

▲ Audio（音频理解）

阿里千问发布全模态大模型 Qwen3.5-Omni，无缝理解文本、图片、音频及音视频输入 width=”1080″ height=”650″>

▲ Text（文本能力）

阿里千问发布全模态大模型 Qwen3.5-Omni，无缝理解文本、图片、音频及音视频输入 width=”1440″ height=”227″>

▲ Speech Generation（语音生成）

用户可以通过阿里云百炼搜索 Qwen3.5-Omni 调用 API，提供了 Plus、Flash、Light 三种尺寸，满足不同场景需求。

AI 新资讯行业资讯 # Qwen3.5 Omni # 通义千问 # 阿里千问

文章版权归作者所有，未经允许请勿转载。

腾讯视频孙忠怀：未来 12 个月，将是 AI 长片涌现的关键窗口期

AI 新资讯行业资讯 # AI 电影 # AI 长片 # 孙忠怀

5个月前

3,692800

“一键”从其它 AI 服务迁移，Anthropic Claude 上线免费“记忆导入”功能

AI 新资讯行业资讯 # Anthropic # Claude

2个月前

2,613451

阿里平头哥自研 AI 芯片“真武 810E”发布，性能比肩英伟达 H20

AI 新资讯行业资讯 # 真武 810E # 阿里平头哥

4个月前

3,047250

新一代人工智能让人产生一种无需学习就能掌握知识的错觉，这可能是人工智能对教育最大的危害

AI 新资讯教育资讯 # 教育技术学自留地

6个月前

6,097298

阿里千问发布全模态大模型 Qwen3.5-Omni，无缝理解文本、图片、音频及音视频输入

Mistral 完成 8.3 亿美元债务融资，所得用于在法建设 AI 数据中心

消息称美光尝试垂直堆叠 GDDR 内存：在标准 GDDR 与 HBM 间开辟新路

相关文章

腾讯视频孙忠怀：未来 12 个月，将是 AI 长片涌现的关键窗口期

“一键”从其它 AI 服务迁移，Anthropic Claude 上线免费“记忆导入”功能

阿里平头哥自研 AI 芯片“真武 810E”发布，性能比肩英伟达 H20

新一代人工智能让人产生一种无需学习就能掌握知识的错觉，这可能是人工智能对教育最大的危害