标签:月之暗面
超越英伟达!字节跳动MegaScale如何实现大规模GPU的高效利用?
在2024年2月,字帖跳动发布了一篇关于大语言模型训练框架的论文《MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs》。MegaScale...
微软就是阿里巴巴眼中自己的样子
阿里巴巴近期在AI大模型领域的投资动作频繁,领投了MiniMax的新一轮融资,使得其估值超过25亿美元。这已是阿里巴巴在2024年宣布的第二笔大模型投资,此前还投...
刚刚,OpenAI劲敌重磅发布Inflection-2.5!性能媲美GPT-4但计算量仅为40%,高情商应用Pi日活已破百万
摘要:Inflection-2.5模型的发布标志着AI领域的新里程碑。这款由Inflection公司开发的新模型,在仅使用40%的计算量的情况下,性能与GPT-4不相上下。这一成就...
深扒Altman巨型AI帝国:从核聚变工厂到永生技术中心,规模惊人!
新智元报道了Sam Altman构建的未来AI帝国的宏伟蓝图。Altman的愿景远超成立科技公司赚钱的范畴,他致力于推广一种世界观,即私营企业和亿万富翁是解决人类重...
书摘丨李永智:生成式AI对教育的影响
本文探讨了学校在创新社会中的角色,强调了新一代人工智能技术,尤其是ChatGPT,对教育领域的深远影响。文章指出,人工智能技术将改变教育的价值观念,从知识...
AI大模型能为数据中台带来什么?
在当前AI技术飞速发展的背景下,市场对于AI中台的关注度日益提高。AI中台的出现,旨在解决传统中台在企业中的闲置问题,通过整合AI技术,如深度学习、计算机...
刚刚!这里杀出187亿超级独角兽:又融了48亿
Figure AI,一家人形机器人创业公司,宣布获得6.75亿美元的B轮融资,估值达到26亿美元。投资方包括英伟达、OpenAI、微软、英特尔、亚马逊等科技巨头,以及知...
ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天
在2024年世界经济论坛上,图灵奖得主Yann LeCun提出了视频模型应该在抽象表征空间中进行预测的观点。本文研究者基于最优传输理论,提出了一种鲁棒的长视频学...
新王Claude 3实测!各项能力给跪,打麻将也会,确实比GPT-4好用
这篇文章主要介绍了由Anthropic公司开发的新型AI模型Claude 3,它在多个方面超越了OpenAI的GPT-4模型。Claude 3不仅在性能上取得了显著的提升,还在多模态能...
刚刚曝光的 Claude3,直击 OpenAI 最大弱点
Anthropic发布了其企业级SOTA大模型Claude3,该模型在多个基准测试中超越了OpenAI的GPT-4和Google的Gemini 1.0 Ultra。Claude3系列包括Haiku、Sonnet和Opus三...