大模型

LLM,VLM,模型

Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍

创建和理解3D结构在科学研究中具有重要意义,它不仅承载了丰富的物理与化学信息,还为解构复杂系统、进行模拟预测和跨学科创新提供了重要工具。随着AI技术的...

“不用高级GPU”!蚂蚁用国产AI芯片狂降百万训练成本,模型性能还与DeepSeek相当

蚂蚁集团在人工智能领域取得了显著进展,通过使用国产芯片和优化技术,成功降低了人工智能模型的训练成本。具体而言,蚂蚁集团在训练“专家混合”(MoE)模型时...

32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强

阿里通义千问Qwen发布了最新视觉语言模型Qwen2.5-VL-32B-Instruct,进一步扩展了其开源家族的产品线。该模型在尺寸和性能之间取得了平衡,能够在本地运行,并...

DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了

DeepSeek V3-0324的发布虽然被官方称为“小版本升级”,但实际表现却远超预期。该版本在多个测试中展现出显著的能力提升,尤其是在复杂问题的处理上。例如,在4...

爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合 | ICLR 2025

块离散去噪扩散语言模型(BD3-LMs)结合了自回归模型和扩散模型的优势,解决了现有扩散模型在生成长度受限、推理效率低和生成质量低等方面的问题。通过块状扩...

AI就是所有人疯狂竞争,最后Google赢得比赛的游戏?

2016年,Google CEO桑达尔·皮查伊宣布公司将转向“AI优先”的战略,标志着Google对人工智能领域的深度押注。2017年,Google研究人员发表了开创性论文《Attentio...

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3-0324的发布标志着AI领域的一次重要升级。该模型拥有6850亿参数,虽然参数增幅不大,但在代码和数学推理能力上取得了显著提升。特别是在代码领域...

刚3月,已有9家AI企业融资超1亿美元

2025年3月,9家AI企业已获得超过1亿美元的融资,显示出资本市场对AI领域的持续青睐。Anthropic在E轮融资中筹集了35亿美元,估值达到615亿美元,其核心产品Cla...

DeepSeek 发布 V3 模型更新:除了编程能力大幅提升,还有更宽松的开源协议

DeepSeek V3 模型的最新更新在编程能力上取得了显著提升,尤其是在前端编码方面。此次更新虽然是小版本升级,但已经在其官方网页、App 小程序等入口开放。新...

Browser Use融资1700万美元,Manus爆火背后的秘密武器

Browser Use是一家专注于AI智能体技术的创业公司,其工具能够帮助智能体更轻松地「读懂」网站,从而自动化处理各种任务。该公司最近完成了1700万美元的种子轮...
1 32 33 34 35 36 567