标签:OpenAI

田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

摘要:本文报道了Meta FAIR的田渊栋及其团队最新研究成果,提出了一种名为GaLore的内存高效的LLM训练方法。该方法通过Gradient Low-Rank Projection实现了在...

挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4

摘要:本文报道了美国 AI 创业公司 Inflection AI 发布的新一代大语言模型 Inflection-2.5,该模型结合了强大的LLM能力和Inflection标志性的「同理心微调」,...

清华姚班本科生连发两作,十年来最大改进:矩阵乘法接近理论最优

通过消除「隐藏的低效」问题,计算机科学家提出了一种比以往更快的大型矩阵相乘新方法。这一进展是在矩阵乘法领域中的重要突破,矩阵乘法不仅是高性能计算中...

中科院等万字详解:最前沿图像扩散模型综述

中科院联合Adobe和苹果公司的研究人员发布了一篇关于图像编辑中扩散模型的重磅综述。这篇综述全文长达26页,包含1.5万余词,涵盖了297篇文献,全面研究了图像...

消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强

在这篇文章中,介绍了李开复旗下AI公司零一万物发布的新AI模型Yi-9B,该模型拥有90亿参数,被称为Yi系列中的“理科状元”。与其他类似规模的开源模型相比,Yi-9...

马斯克Ilya私密邮件被Claude破译,OpenAI打码信息公开,谷歌很受伤

模型信息 【模型公司】 OpenAI 【模型名称】 gpt-3.5-turbo-0125 【摘要评分】 ★★☆☆☆   文章摘要 【关 键 词】 AI、谜题、破解、网友、OpenAI ...

人大系初创与OpenAI三次“撞车”:类Sora架构一年前已发论文

金磊和衡宇从凹非寺发来的报道揭示了一个引人入胜的故事,关于一家位于中关村的创业公司——智子引擎,以及它与OpenAI技术上的“撞车”事件。这家公司凭借其在多...

评选报名中!2024年最值得关注的AIGC企业&产品评选,有料你就来 🥇

在2024年的中国AIGC产业中,量子位将评选出最值得关注的AIGC企业和最值得期待的AIGC产品。评选的参选条件和标准都十分严格,企业需要符合一系列要求才能参与...

她才是赶奥特曼下台的关键人物?OpenAI CTO劲爆大瓜

摘要:文章揭露了OpenAI内部的一场风波,涉及到前CTO Mira Murati在奥特曼被赶下台中发挥的关键作用。奥特曼被指操纵高层管理者,引发董事会的担忧,最终导致...

40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果

摘要:克雷西报道了由DeepMind联合创始人Mustafa Suleyman领导的大模型初创公司Inflection-2.5推出的新产品Pi,以及该公司背后的故事。Inflection-2.5是一款...
1 42 43 44 45 46 60