大模型
LLM,VLM,模型
首个AI软件工程师Devin完整技术报告出炉,还有人用GPT做出了「复刻版」
Cognition AI 团队最近发布了首个 AI 软件工程师 Devin,这一事件在 AI 社区引起了广泛关注,并引发了对程序员职业未来前景的讨论。Devin 的能力通过 SWE-ben...
ChatGPT参数规模被扒:只有7B
这篇文章报道了南加州大学团队对ChatGPT进行攻击并揭露其参数规模的研究成果。他们使用一种攻击方法,仅花费不到1000美元就成功挖出了最新版gpt-3.5-turbo模...
大模型增速远超摩尔定律!MIT最新研究:人类快要喂不饱AI了
近日,MIT的研究人员发表了一项关于大模型能力增速的研究,指出LLM的能力每8个月翻一倍,远超过摩尔定律。这意味着硬件可能无法跟上大模型的需求,引发了人们...
AI干6周=生物学家134年!斯坦福生物学基础模型开启生物学AI时代
开发了一种,该模型在短短内发现了人类花了才发现的,标志着生物学的开启。Norn细胞是一种肾细胞,能感知缺氧状态并合成促红细胞生成素(Epo),对氧稳态调节至...
如何把大模型压缩到1bit?论文作者这样说
这篇文章讨论了对大模型进行压缩的重要性,尤其是在部署代价高昂的情况下。模型量化是一种压缩方法,通过将大模型的参数转换为低位宽的表示来节省空间占用。...
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述
机器之心编辑部撰写的这篇文章主要讨论了大语言模型(LLMs)的知识蒸馏技术及其在研究和工业界中的应用。文章首先指出,尽管闭源LLMs如GPT-4、Gemini和Claude...
一句指令就能冲咖啡、倒红酒、锤钉子,清华具身智能CoPa「动」手了
本文介绍了清华大学叉院高阳教授机器人研究团队最新提出的具身智能框架CoPa(Robotic Manipulation through Spatial Constraints of Parts),该框架利用视觉...
苹果为杀入AI领域低调收购,iOS 18要有大动作
这篇文章报道了苹果公司在人工智能领域的最新动态。首先介绍了苹果在AI领域的布局,包括放弃造车项目,转向GenAI领域,并披露了多模态大模型。苹果还进行了战...
流浪地球里的数字生命计划启动了?DeepMind在电脑里造果蝇,网友:能造人吗?
电影《流浪地球2》中,刘德华饰演的图恒宇因希望让已故女儿拥有完整的一生,不顾禁令,致力于完善数字生命架构,并冒险将女儿数据上传至量子计算机,最终被捕...
国产大模型创业一哥:秀商业化,布局Sora,“全线对标OpenAI”
文章介绍了智谱AI在商业化领域的最新进展,包括融资、投资和商业化成果。智谱AI在过去一年中获得了超过25亿元的融资,同时积极投资于大模型公司。在商业化方...