“GPT-2”的搜索结果

Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式
这篇文章介绍了生成式AI领域中的两个主导模型:自回归模型和扩散模型。自回归模型专注于处理离散数据,如文本,通过预测下一个token来生...
OpenAI 创始成员用 1000 行 C 代码手搓了一个大模型,Mac 即可运行!网友:真男人就该用C编程
Andrej Karpathy,特斯拉前AI总监和OpenAI创始团队成员,近期使用仅1000行的C语言代码实现了GPT-2大模型的训练过程。这一成就不仅展示了...
GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式
  文章摘要 【关 键 词】 VAR、图像生成、自回归模型、扩散模型、Scaling Laws 机器之心最近发布了一篇关于新一代视觉生成范...
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程
Andrej KarpathyAndrej Karpathy,一位在人工智能领域享有盛誉的大神,近期复出并带来了一项引人注目的项目:使用纯C语言实现GPT的训练...
讨论下一个token预测时,我们可能正在走进陷阱
机器之心报道,编辑赵阳,最近围绕下一个token预测的讨论日益激烈。然而,许多人认为,下一个token预测的目标无法真正模拟人类思维。人...
OpenAI官宣开源Transformer Debugger!不用写代码,人人可以破解LLM黑箱
新智元报道,OpenAI超级对齐团队负责人宣布开源Transformer调试器(TDB),这将使研究人员能够在不编写代码的情况下快速探索大型语言模...
马斯克正式起诉OpenAI、Sam Altman
本文讨论了专注于AIGC领域的专业社区,关注大语言模型(LLM)的发展和应用,特别是微软、OpenAI、百度文心一言和讯飞星火等。文章提到了...
1 2 3 4