大模型

LLM,VLM,模型

ICML直击丨包揽最佳论文、现场发offer抢人…学术顶会变成了“大厂”顶会

7月27日,ICML(国际机器学习大会)在奥地利维也纳会展中心圆满落幕。作为机器学习领域的顶级会议之一,本届ICML共收到9473篇论文投稿,较去年增长44%,其中2...

训练一次经历 419 次意外故障!英伟达 GPU 也差点玩不转 405B 模型,全靠 Meta 工程师后天救场!

Meta的研究报告详细描述了在训练Llama 3 405B参数模型时所面临的重大挑战。该模型在16384个Nvidia H100 GPU的集群上运行,平均每三小时发生一次故障,54天内...

Meta开源用于数学等复杂推理AI Agent—HUSKY

由Meta、华盛顿大学和阿伦AI实验室联合开发的HUSKY,是一款专注于数学和表格等复杂推理任务的AI Agent。HUSKY的创新之处在于其统一的行动空间设计,允许AI在...

GPT-4o mini凭什么登顶竞技场?OpenAI刷分秘诀被扒,原来奥特曼早有暗示

在lmsys竞技场公布的榜单中,GPT-4o mini与满血版并列第一,引发了广泛争议。许多人质疑这一结果,认为lmsys可能受到了OpenAI的影响。然而,官方随后公布了GP...

人力、资金成本大幅下降,最早上车 Agent 的企业已经开始获益

AI Agent技术正成为人工智能领域的新焦点,预示着一波新的技术浪潮。据外媒MattSchlicht报道,目前有约100个项目致力于AI代理的商业化,近10万名开发人员正在...

Sam Altman:为防止中国超越,美国应加强AI的4大投入

OpenAI联合创始人Sam Altman在《华盛顿邮报》发表文章《Who will control the future of AI?》,强调AI创新和持续发展的重要性。他认为,美国在生成式AI和大...

日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?

2024年,AI图像生成技术取得了显著进步,其中Midjourney v6、Stable Diffusion 3和DALL・E 3等国际知名模型备受关注。与此同时,国产AI领域也取得了突破性进...

1890美元,就能从头训练一个还不错的12亿参数扩散模型

Sony AI等机构的研究者开发了一种低成本的端到端pipeline,用于训练文本到图像的扩散模型,显著降低了训练成本,同时不需要访问数十亿张训练图像或专有数据集...

阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进

杨红霞,一位在人工智能领域具有重要影响力的科学家,最近加入了香港理工大学,担任电子计算机系教授。她曾在IBM T.J.沃森研究中心和雅虎担任要职,并在2016...

陶哲轩点评谷歌AlphaProof:AI在数学竞赛中展现「超凡智慧」

谷歌DeepMind的人工智能系统在2024年国际数学奥林匹克竞赛(IMO)中取得了显著成绩,其得分接近金牌水平。在IMO的六个问题中,该系统解决了四个并获得满分,...
1 179 180 181 182 183 454