除了Qwen,阿里还有什么好东西?

AIGC动态3小时前发布 Si-Planet
89 0 0
除了Qwen,阿里还有什么好东西?

 

文章摘要


【关 键 词】 阿里模型文生图模万相系列Web系列阿里开源

8月5日,阿里巴巴通义千问团队开源Qwen – Image文生图模型,该模型针对中文复杂排版与高精度图像编辑优化,引发开发者对其与万相系列模型功能是否重复的疑问。

阿里模型家族分工明确且规模庞大:阿里迄今已开源200余款模型,覆盖全模态领域,参数规模多样。Qwen团队负责语言及推理模型,Wan团队专注图像和视频模型,AlibabaLab推出WebSearch模型。

Wan万相系列:由通义万相实验室主导,是视觉生成模型,具备多种生成能力,应用于影视、动画、广告等领域。2024年2月视频生成模型开源,降低行业门槛,表现亮眼。目前在HuggingFace开源20款模型,总下载量超350万次,GitHub获超13k星标。与Qwen – Image技术路线不同,Qwen – Image擅长复杂文本渲染,适合海报设计等场景;Wan系列以视频为中心,适合视频内容创作等场景,二者形成互补。其采用激进开源策略,降低企业和开发者使用门槛,与Qwen系列功能互补。

Alibaba – NLP团队的Web系列:WebSailor定位对标OpenAI的DeepResearch,解决复杂网络检索和推理任务。在BrowseComp评测集上成绩惊艳,超越多个闭源模型,仅次于DeepResearch。背后团队Alibaba – NLP研究力量分布在达摩院语言技术实验室和通义实验室,学术底蕴深厚,已发布48款开源模型,形成完整网络智能体产品矩阵。

其他零散模型:通义Lab的ThinkSound是音频模型,引入Chain – of – Thought,支持多种输入输出同步音轨和对象级交互编辑,技术栈有三个量级,在公开基准领先。AMAP – ML团队推出地图模型,2025年7月开源14个仓库,目标是将高德数据蒸馏成空间大模型,有三条主线,底层提供时空向量底座,已与多家企业落地。

阿里坚持“真开源”战略,几乎所有核心技术完全开源,在全球范围内成为最拥护开源战略的巨头公司。

原文和模型


【原文链接】 阅读原文 [ 2716字 | 11分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...