大模型

LLM,VLM,模型

刚刚!国内AI公司公布全新垂类模型,北师大教授:中国仅有150万张GPU芯片,亟待发展小模型|钛媒体AGI

3月17日下午,北京师范大学京师大模型传播应用系统发布第2期暨大模型垂类应用论坛上,上海云阙智能科技有限公司发布了一款营销垂直大模型·云阙 AI 平台产品。...

极大降低大模型训练内存需求,Meta等推出高效方法

该文章介绍了一个名为GaLore的高效训练方法,旨在解决大型语言模型在预训练过程中对内存需求过高的问题。研究人员发现,在训练过程中,梯度矩阵会自然呈现出...

Sora并非完美,致命缺点也很多

这篇文章主要介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。文章提到了华尔街日...

专访上海大学方昱春教授:数据驱动的手语识别研究,如何破解数据之困?|GAIR live

本文主要讲述了上海大学的方昱春教授如何将计算机视觉技术与手语研究相融合,开辟出一片新的研究天地。方教授的研究重点在于利用计算机视觉技术(CV)探索手...

炸裂登场!搭载了 ChatGPT 的机器人到底有多强 | 大模型一周大事

在过去的一周里,大模型行业迎来了一系列重要进展。本文将对这些进展进行详细总结,包括新产品发布、科研领域的突破、基础设施的更新以及即将到来的活动。首...

如何用 AI 更“聪明”地进行物流路线规划?

本文介绍了 NVIDIA cuOpt,一款加速优化引擎,旨在帮助团队解决复杂的路线规划问题,重塑物流、运营研究、运输和供应链优化。cuOpt支持多种物流优化用例,如...

刚刚!马斯克履约开源Grok,超越Llama成全球最大开源模型,却被怀疑是作秀?!

马斯克宣布开源Grok,兑现了之前的承诺。Grok-1是一个由xAI从头训练的3140亿参数的混合专家模型,其架构在2023年10月使用自定义训练堆栈在JAX和Rust上开发,...

Sora为何没能诞生在中国?

硅谷AI初创公司Pika lab推出自研视频生成模型的新功能,可同时生成画面和声音,这是AI生成视频的一次重要突破。OpenAI发布的大模型Sora,能根据简单的文本提...

COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim

本文介绍了哈工大联合度小满推出的针对多模态模型的自适应剪枝算法 SmartTrim,该算法旨在解决基于 Transformer 结构的视觉语言大模型(VLM)在实际环境中部...
1 352 353 354 355 356 442