“工作原理”的搜索结果

Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star
Meta发布开源大模型llama3系列后,该模型在多个关键基准测试中表现优异,尤其在代码生成任务上处于领先地位。开发者们迅速开始尝试本地...
在对齐 AI 时,为什么在线方法总是优于离线方法?
在人工智能对齐领域,在线方法和离线方法在性能上存在显著差异。DeepMind的最新研究通过实证剖析,探讨了在线算法普遍优于离线算法的根...
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
在最近的一项研究中,来自加州大学圣地亚哥分校(UCSD)的认知科学研究团队进行了一项实证研究,测试了大型语言模型GPT-4是否能在图灵测...
CVPR 2024|多模态场景感知,小红书高保真人体运动预测方法来了!
< strong >SIF3D(Sense-Informed Forecasting of 3D human motion)是一种由小红书创作发布团队提出的先进场景感知运动预测技术,已被...
为什么谷歌没有加入销售AI硬件(TPU)的游戏?
文章首先提到了NVIDIA的GPU在AI硬件市场的主导地位,以及谷歌的TPU(张量处理单元)只能在谷歌云上使用,而不对外销售。接着,文章深入...
突破摩尔定律极限!前谷歌量子计算团队首创「热力学计算机」,英伟达GPU「退役」?
新智元报道了一家名为Extropic的新公司,该公司由前谷歌量子计算团队的员工创立,提出了一种全新的计算方式,即利用物质随机波动驱动计...
通用人工智能是不可能实现的
本文是一位资深AI开发者、联合创始人及多家AI相关公司董事的观点分享,旨在揭示人们对人工智能(AI)的普遍误解,特别是关于通用人工智...
OpenAI 创始成员用 1000 行 C 代码手搓了一个大模型,Mac 即可运行!网友:真男人就该用C编程
Andrej Karpathy,特斯拉前AI总监和OpenAI创始团队成员,近期使用仅1000行的C语言代码实现了GPT-2大模型的训练过程。这一成就不仅展示了...
图文详解Transformer为什么如此强大
Transformer模型自问世以来,已经在自然语言处理(NLP)领域取得了革命性的进展,并且其影响力已经扩展到了NLP之外的其他领域。Transfor...
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源
最近,多模态大模型(LMM)在视觉-语言任务上取得了显著的进展,尤其是在视觉场景下的应用。然而,将LMM应用于计算机视觉任务,特别是图...
1 2 3 4 5 6 7