“机器之心”的搜索结果

日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?
2024年,AI图像生成技术取得了显著进步,其中Midjourney v6、Stable Diffusion 3和DALL・E 3等国际知名模型备受关注。与此同时,国产AI...
1890美元,就能从头训练一个还不错的12亿参数扩散模型
Sony AI等机构的研究者开发了一种低成本的端到端pipeline,用于训练文本到图像的扩散模型,显著降低了训练成本,同时不需要访问数十亿张...
陶哲轩点评谷歌AlphaProof:AI在数学竞赛中展现「超凡智慧」
谷歌DeepMind的人工智能系统在2024年国际数学奥林匹克竞赛(IMO)中取得了显著成绩,其得分接近金牌水平。在IMO的六个问题中,该系统解...
为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下
在AI领域,大型语言模型(LLM)的低级错误问题引起了广泛关注。Tokenization作为其中的关键因素,其将文本分解为token的过程可能导致模...
反转了?在一场新较量中,号称替代MLP的KAN只赢一局
多层感知器(MLP)作为深度学习模型的基本组成部分,在机器学习领域具有不可替代的地位。然而,MLP存在一些局限性,如难以解释的表示和...
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
智谱AI近期推出了一款名为「清影」的视频生成大模型,标志着公司在视频生成领域的重大进展。该模型能够根据用户简短的创意描述,在30秒...
Nature封面:AI训练AI,越训越离谱
最新研究在《自然》杂志上发表,指出使用AI生成的数据训练大型模型可能导致模型崩溃。牛津大学等机构的研究表明,过度依赖自动生成的数...
字节大模型同传智能体,一出手就是媲美人类的同声传译水平
近年来,人工智能在自然语言处理领域取得了显著进展,但同声传译(Simultaneous Interpretation, SI)依然是一个挑战。传统的同声传译软...
Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了
Meta Llama 3.1 405B的发布标志着开源大语言模型在功能和性能方面开始超越封闭模型,预示着开源AI的新时代。Meta创始人扎克伯格在长文中...
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了
Llama 3.1是由Meta公司发布的新一代大型语言模型,其上下文长度扩展至128K,并推出了8B、70B和405B三个版本,显著提升了大模型赛道的竞...
1 9 10 11 12 13 55