大模型
LLM,VLM,模型
Sora为何没能诞生在中国?
硅谷AI初创公司Pika lab推出自研视频生成模型的新功能,可同时生成画面和声音,这是AI生成视频的一次重要突破。OpenAI发布的大模型Sora,能根据简单的文本提...
COLING24|自适应剪枝让多模态大模型加速2-3倍,哈工大等推出SmartTrim
本文介绍了哈工大联合度小满推出的针对多模态模型的自适应剪枝算法 SmartTrim,该算法旨在解决基于 Transformer 结构的视觉语言大模型(VLM)在实际环境中部...
首个AI软件工程师Devin完整技术报告出炉,还有人用GPT做出了「复刻版」
Cognition AI 团队最近发布了首个 AI 软件工程师 Devin,这一事件在 AI 社区引起了广泛关注,并引发了对程序员职业未来前景的讨论。Devin 的能力通过 SWE-ben...
ChatGPT参数规模被扒:只有7B
这篇文章报道了南加州大学团队对ChatGPT进行攻击并揭露其参数规模的研究成果。他们使用一种攻击方法,仅花费不到1000美元就成功挖出了最新版gpt-3.5-turbo模...
大模型增速远超摩尔定律!MIT最新研究:人类快要喂不饱AI了
近日,MIT的研究人员发表了一项关于大模型能力增速的研究,指出LLM的能力每8个月翻一倍,远超过摩尔定律。这意味着硬件可能无法跟上大模型的需求,引发了人们...
AI干6周=生物学家134年!斯坦福生物学基础模型开启生物学AI时代
开发了一种,该模型在短短内发现了人类花了才发现的,标志着生物学的开启。Norn细胞是一种肾细胞,能感知缺氧状态并合成促红细胞生成素(Epo),对氧稳态调节至...
如何把大模型压缩到1bit?论文作者这样说
这篇文章讨论了对大模型进行压缩的重要性,尤其是在部署代价高昂的情况下。模型量化是一种压缩方法,通过将大模型的参数转换为低位宽的表示来节省空间占用。...
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述
机器之心编辑部撰写的这篇文章主要讨论了大语言模型(LLMs)的知识蒸馏技术及其在研究和工业界中的应用。文章首先指出,尽管闭源LLMs如GPT-4、Gemini和Claude...
一句指令就能冲咖啡、倒红酒、锤钉子,清华具身智能CoPa「动」手了
本文介绍了清华大学叉院高阳教授机器人研究团队最新提出的具身智能框架CoPa(Robotic Manipulation through Spatial Constraints of Parts),该框架利用视觉...