阿里通义实验室开源影视级配音多模态大模型 Fun-CineForge,解决音画同步与情感表达难题 阿里通义实验室开源了 Fun-CineForge 多模态大模型,专为影视级配音设计。它通过引入“时间模态”和高质量数据集 CineDub,解决了传统 AI 配音在口型同步、情绪表达、音色一致和时间对齐... AI 新资讯行业资讯# ai# 大模型# 阿里通义 3天前916886
一句话即可自由生成,阿里通义语音双模型 Fun-CosyVoice3.5 与 Fun-AudioGen-VD 发布 阿里通义实验室语音团队今日发布了两款支持 FreeStyle 指令生成的模型 Fun-CosyVoice3.5 与 Fun-AudioGen-VD。 AI 新资讯行业资讯# 语音模型# 阿里通义 2周前1,484786
多模态检索新标杆,阿里通义发布并开源 Qwen3-VL-Embedding&Reranker 模型 阿里通义今日发布并开源Qwen3-VL-Embedding和Qwen3-VL-Reranker模型,专为多模态信息检索设计,支持文本、图像、视频等混合内容统一理解,在权威基准测试中表现领先。开源地址已... AI 新资讯行业资讯# Qwen3# 阿里通义 2个月前2,896866
阿里通义 Qwen-lmage-Edit-2511 图像编辑 AI 模型开源,支持两人隔空“合照” Qwen-Image-Edit 是阿里通义团队推出的图像编辑模型。2511 版本中着重进行了包括一致性提升在内的多项增强,新版本的整体生成质量、尤其是人物生成质量,得到显著提升。 AI 新资讯行业资讯# QwenlmageEdit# 阿里通义 3个月前3,415229
阿里通义 Qwen3-TTS 家族上新两款 AI 模型:声音不仅能复制,还可以定制 Qwen3-TTS 家族新推出两款模型,音色创造模型 Qwen3-TTS-VD-Flash 和音色克隆模型 Qwen3-TTS-VC-Flash。 AI 新资讯行业资讯# Qwen3TTS# 声音模型# 阿里通义 3个月前3,708501
阿里通义发布端到端语音交互模型 Fun-Audio-Chat,能猜出你的心情 阿里通义本次开源了 Fun-Audio-Chat 8B,该模型在 OpenAudioBench、MMAU、Speech-ACEBench、VStyle 等多个榜单上“同尺寸模型排名第一”,综合性能超 ... AI 新资讯行业资讯# FunAudioChat# 语音交互模型# 阿里通义 3个月前3,618166
阿里发布万相 2.6 系列模型,上线国内首个角色扮演功能 阿里发布新一代万相2.6系列模型,支持角色扮演、多镜头生成及声音驱动等功能,是全球功能最全的视频生成模型。已上线阿里云百炼、万相官网。#AI视频生成# #阿里万相2.6# AI 新资讯行业资讯# 万相2.6# 通义万相# 阿里通义 3个月前2,746901