标签:GPT-2

Karpathy最新四小时视频教程:从零复现GPT-2,通宵运行即搞定

AI领域专家Andrej Karpathy推出了长达四小时的教程视频,主题为“让我们来复现GPT-2(1.24亿参数)”。该视频属于“Neural Networks:zero to hero”系列,内容全...

Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练

AI领域的大神Karpathy近日成功复现了OpenAI的经典成果GPT-2,而且仅用了20美元、90分钟就完成了训练,令人震惊的是,其Loss和评测还超越了原版。他使用的是A1...

OpenAI 创始成员用 1000 行 C 代码手搓了一个大模型,Mac 即可运行!网友:真男人就该用C编程

Andrej Karpathy,特斯拉前AI总监和OpenAI创始团队成员,近期使用仅1000行的C语言代码实现了GPT-2大模型的训练过程。这一成就不仅展示了Karpathy在人工智能领...

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

Andrej Karpathy,前特斯拉Autopilot负责人和OpenAI科学家,近日发布了一个名为「llm.c」的项目,该项目仅使用大约1000行纯C语言代码,就能在CPU/fp32上实现G...