文章摘要
【关 键 词】 NeurIPS、视觉自回归、图像生成、AI模型、深度学习
人工智能领域的顶级会议NeurIPS 2024近日公布了年度最佳论文奖,其中一篇获奖论文由字节跳动团队与北京大学合作完成,论文第一作者为田柯宇。田柯宇此前因破坏大模型训练被字节跳动开除,并被要求赔偿侵权损失800万元及合理支出2万元。该论文在NeurIPS 2024中获得第六高分,并在GitHub和Paperwithcode上受到广泛关注。
事件起源于10月,网上流传消息称字节跳动实习生利用AI模型共享平台Hugging Face的漏洞,注入破坏代码,导致8000多张GPU集群的训练结果错误。字节跳动随后澄清,涉事实习生已被辞退,并将其行为通报给行业联盟和学校。字节跳动还发布内部通报,披露了事件细节。
田柯宇的获奖论文提出了视觉自回归建模(VAR),首次使GPT类自回归模型在图像生成领域超越了扩散transformers模型。VAR重新定义了图像领域的自回归学习,将图像编码为多尺度token图,从1×1 token图开始逐步扩大分辨率。VAR在ImageNet 256×256基准测试中显著提高了自回归模型的性能,并在FID/IS、数据效率、推理速度及可扩展性方面超过了Diffusion Transformer。
NeurIPS是AI、ML和数据科学领域最具影响力的会议之一,今年共收到15671篇有效论文投稿,录用率为25.8%。田柯宇本科毕业于北京航空航天大学软件学院,研究生就读于北京大学,研究兴趣为深度学习的优化与算法。他已在字节跳动实习研究,并多次担任顶级会议审稿人。
原文和模型
【原文链接】 阅读原文 [ 1912字 | 8分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆