大模型
LLM,VLM,模型
马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载
马斯克旗下的大模型公司xAI宣布正式开源了3140亿参数的混合专家(MoE)模型「Grok-1」,这是目前参数量最大的开源大语言模型。Grok-1模型从头开始训练,没有...
没等来OpenAI,等来了Open-Sora全面开源
机器之心编辑部近期报道了OpenAI Sora视频生成模型的开源进展。Sora因其出色的视频生成效果而受到全球关注。在成本降低46%的Sora训练推理复现流程发布两周后...
AI大模型控制红绿灯,港科大(广州)智慧交通新成果已开源
香港科技大学(广州)的研究团队提出了一个名为LLMLight的框架,用于实现交通信号控制(TSC)。该框架结合了大模型的泛化能力和人类直觉的推理和决策过程,以...
刚刚!国内AI公司公布全新垂类模型,北师大教授:中国仅有150万张GPU芯片,亟待发展小模型|钛媒体AGI
3月17日下午,北京师范大学京师大模型传播应用系统发布第2期暨大模型垂类应用论坛上,上海云阙智能科技有限公司发布了一款营销垂直大模型·云阙 AI 平台产品。...
极大降低大模型训练内存需求,Meta等推出高效方法
该文章介绍了一个名为GaLore的高效训练方法,旨在解决大型语言模型在预训练过程中对内存需求过高的问题。研究人员发现,在训练过程中,梯度矩阵会自然呈现出...
Sora并非完美,致命缺点也很多
这篇文章主要介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。文章提到了华尔街日...
专访上海大学方昱春教授:数据驱动的手语识别研究,如何破解数据之困?|GAIR live
本文主要讲述了上海大学的方昱春教授如何将计算机视觉技术与手语研究相融合,开辟出一片新的研究天地。方教授的研究重点在于利用计算机视觉技术(CV)探索手...
炸裂登场!搭载了 ChatGPT 的机器人到底有多强 | 大模型一周大事
在过去的一周里,大模型行业迎来了一系列重要进展。本文将对这些进展进行详细总结,包括新产品发布、科研领域的突破、基础设施的更新以及即将到来的活动。首...
如何用 AI 更“聪明”地进行物流路线规划?
本文介绍了 NVIDIA cuOpt,一款加速优化引擎,旨在帮助团队解决复杂的路线规划问题,重塑物流、运营研究、运输和供应链优化。cuOpt支持多种物流优化用例,如...
刚刚!马斯克履约开源Grok,超越Llama成全球最大开源模型,却被怀疑是作秀?!
马斯克宣布开源Grok,兑现了之前的承诺。Grok-1是一个由xAI从头训练的3140亿参数的混合专家模型,其架构在2023年10月使用自定义训练堆栈在JAX和Rust上开发,...