标签:深度学习
让Sora和ChatGPT更可靠!只需这个知识价值定量评估新框架
这篇文章讨论了如何将人类知识注入大型AI模型以提高其效率和推理能力。为了解决数据和知识对模型的影响平衡问题,美国国家工程院院士张东晓和宁波东方理工大...
哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?
智东西报道了深度学习领域的一个重要讨论:视频生成器是否可以被视为世界模拟器。Meta首席科学家杨立昆分享了一篇探讨这一问题的万字博文,引发了业界的广泛...
字节模型来了!把字节当作token,统一一切,预测一切?
本文介绍了一种名为bGPT(byte GPT,字节GPT)的深度学习模型,它专门用于处理二进制数据和模拟数字世界。bGPT突破了传统语言模型的局限,能够直接理解和操作...
不依赖token,字节级模型来了!直接处理二进制数据
文章介绍了微软亚洲研究院等机构发布的新型GPT模型bGPT,该模型不再预测token,而是基于Transformer模型预测下一个字节。bGPT通过处理原生二进制数据,将所有...
教授何恺明在MIT的第一堂课
这篇文章报道了麻省理工学院(MIT)计算机视觉课《Advances in Computer Vision》6.8300 在 2024 新学期的盛况,教室座无虚虚,吸引了众多学生。其中,新晋教...
RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba
摘要:谷歌 DeepMind 最近推出了两种新的 AI 模型,Hawk 和 Griffin,它们在基础模型方面为 AI 领域提供了新的选择。这些模型是基于循环神经网络(RNN)的,...
北大发起复现Sora,框架已搭!袁粒田永鸿领衔,AnimateDiff大神响应
北大信息工程学院的袁粒教授和田永鸿教授领衔的团队联合兔展发起了一项名为Open Sora的Sora复现计划。该计划旨在集结开源社区的力量,以有限的资源尽可能完成...
大模型到底能有多“大”?
本文主要探讨了大数据产业创新服务媒体的相关内容,重点分析了大数据在人工智能领域的应用及影响。文章首先介绍了深度学习技术在大数据背景下的发展,以及如...
Fine-tuning在垂直领域的最佳实践指南
摘要总结:本文介绍了深度学习和机器学习中的一个重要概念——Fine-tuning(模型微调)。Fine-tuning通常在预训练模型的基础上进行,通过在特定任务的数据集上...
ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型
摘要:图像匹配是计算机视觉中的关键任务,对于三维重建、视觉定位等应用至关重要。传统算法如SIFT在复杂场景下表现有限,而基于深度学习的模型受限于特定场...