大模型

LLM,VLM,模型

苹果发布高效双EMA梯度优化方法,适配Transformer、Mamba模型

在深度学习模型训练中,优化非凸损失函数是一个挑战,尤其是当使用依赖于指数移动平均(EMA)的优化器如Adam和AdamW时。这些优化器可能在处理超大规模数据集...

Sam Altman泄露新模型o2,太会整活了,营销鬼才!

OpenAI首席执行官Sam Altman发布了一条关于o2模型在GPQA性能测试中达到105%的消息,这一数据远超过人类博士级专家的平均准确率65%和普通人的34%,甚至超过了o...

不止于人形:优必选、地瓜机器人、加速进化眼中的机器人产业新图景

在全球机器人和人工智能技术快速发展的背景下,中国机器人产业迎来了前所未有的发展机遇。在硅星人首届AI创造者大会(ACC 2024)上,五位行业专家就产业链协...

中国科学院院士何积丰:普通人如何用好AI大模型产生更大价值?|钛媒体AGI

中国科学院院士何积丰在上海华科智谷人工智能研究院发表演讲,探讨了普通人如何利用AI大模型技术提升社会价值。他回顾了AI技术自1956年提出以来的发展历程,...

o1图像理解神秘现身,网友疯狂测试!Altman自曝:o2研究生级水平破105%

近期,网络上出现了关于o1图像理解功能的广泛讨论和测试。用户发现,通过选择ChatGPT 4o mini模型并上传图片,o1能够进行图像理解。这一功能原本是OpenAI未来...

LLM 比之前预想的更像人类,竟也能「三省吾身」

近期,一个多机构联合团队的研究证实了语言模型(LLM)可以通过内省来了解自身。这项研究的论文标题为“Looking Inward: Language Models Can Learn About The...

o1满血版泄露!奥数题图片推理手拿把掐,奥特曼上线剧透o2

近期,OpenAI的完整版o1模型意外泄露,允许用户直接体验其功能。泄露的模型展现出了强大的图像推理能力,能够处理上传的附件并进行多模态交互。在测试中,o1...

谷歌超四分之一代码由 AI 生成,CEO:我们的收入甚至超过了华尔街!

谷歌首席执行官Sundar Pichai在2024年第三季度财报电话会议上透露,谷歌超过四分之一的新代码由人工智能生成,并由工程师审查和接受。谷歌母公司Alphabet第三...

大模型玩你画我猜:Claude6局3胜,GPT-4o表现迷惑

最近,一种新的测试基准在人工智能领域引起了广泛关注,即让大型AI模型参与“你画我猜”游戏。在这个游戏中,一个模型负责画画,其他模型则根据生成的内容猜测...

OpenAI华人科学家翁荔:人类如何培养出下一代聪明且安全的AI技术|钛媒体AGI

在2024年Bilibili超级科学晚上,OpenAI研究副总裁翁荔发表了关于AI安全与培养的演讲。她强调,随着AI技术的快速发展,确保其行为符合人类价值观和安全性变得...
1 21 22 23 24 25 391