“GPT-2”的搜索结果

奥特曼:o1仅仅是“推理模型的GPT-2”;黄仁勋:我给你加速50倍
在最近一场活动中,OpenAI的CEO奥特曼和英伟达的创始人黄仁勋共同讨论了人工智能的未来。奥特曼暗示,OpenAI即将在未来几个月发布o1的完...
黑匣子被打开了!能玩的Transformer可视化解释工具,本地运行GPT-2、还可实时推理
在2017年,谷歌发表的论文《Attention is all you need》中提出了Transformer架构,对深度学习领域产生了深远影响。该架构不仅在文本和...
Karpathy又整活儿了!一天训练出GPT-2、成本还骤降100倍,网友:dream老黄把价格再打下来
OpenAI的创始成员和前研究科学家Andrej Karpathy最近成功地在单个八H100节点上重现了GPT-2(1.6B)模型,整个过程仅需24小时,成本为672...
五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活
2019年2月,OpenAI发布了具有15亿参数的GPT-2模型,该模型在文本生成方面表现出色,充分利用了预训练的Transformer架构,被认为是大型预...
Karpathy最新四小时视频教程:从零复现GPT-2,通宵运行即搞定
AI领域专家Andrej Karpathy推出了长达四小时的教程视频,主题为“让我们来复现GPT-2(1.24亿参数)”。该视频属于“Neural Networks:zero ...
Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练
AI领域的大神Karpathy近日成功复现了OpenAI的经典成果GPT-2,而且仅用了20美元、90分钟就完成了训练,令人震惊的是,其Loss和评测还超越...
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星
AI研究者Andrej Karpathy最近发布了一个引人注目的项目,该项目展示了如何仅使用大约1000行的纯C语言代码来训练GPT-2模型,而不依赖于庞...
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了
Andrej Karpathy,前特斯拉Autopilot负责人和OpenAI科学家,近日发布了一个名为「llm.c」的项目,该项目仅使用大约1000行纯C语言代码,...
中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻
摘要:OpenAI研究员Jason Wei将Sora视频生成模型比作视频领域的GPT-2,预示着视频生成技术的新时代。Sora能够创作出具有艺术感和逼真度...
史上最大规模!OpenAI官宣完成464亿新融资,万亿 AI 独角兽诞生|钛媒体AGI
美国OpenAI公司于2023年10月3日宣布完成了66亿美元的新一轮融资,公司估值达到1570亿美元。这轮融资规模巨大,是硅谷历史上最大的单轮融...
1 2 3 4