标签:月之暗面
CNN、Transformer、Uniformer之外,我们终于有了更高效的视频理解技术
视频理解技术旨在准确把握视频中的时空信息,但面临着短视频片段的时空冗余和复杂时空依赖关系的双重挑战。传统的三维卷积神经网络(CNN)和视频Transformer...
2024 全球开发者先锋大会开幕,探讨 AGI 与前沿技术
2024年全球开发者先锋大会(GDC)在上海成功举行,由上海市人工智能行业协会(SAIA)主办。本次大会以“模速空间——开发者的模力之源”为主题,聚集了全球开发者...
图解Transformer架构设计
近年来,Transformer技术在自然语言处理(NLP)领域引起了巨大关注。Transformer是一种新型架构,利用注意力机制显著提升深度学习NLP翻译模型性能。自从在论...
Stability AI 终于甩开了它劣迹斑斑的CEO
明星创业公司Stability AI近期遭遇重大变故,公司CEO Emad Mostaque宣布辞职。Mostaque解释称,由于他在公司的多数投票权和对董事会的绝对控制权,他决定辞职...
一年暴涨900%,这个华人成为黄院士门下最大赢家
超微电脑(SMCI)在过去一年中以其惊人的股价增长成为了AI领域的一匹黑马。在AIGC兴起的15个月内,超微电脑的股价飙升了1300%,远超英伟达的530%。这一成就使...
UC伯克利「LLM排位赛」结果出炉!Claude 3追平GPT-4并列第一
新智元报道了Anthropic公司推出的Claude 3模型,该模型在数据集跑分和用户体验方面均领先于GPT-4。尽管以往的新模型在跑分上超越GPT-4,但实际体验往往不如GP...
复刻Sora的通用视频生成能力,开源多智能体框架Mora来了
何恺明的目标是探索面向复杂世界的智能。Sora是首个引起广泛关注的大规模通用视频生成模型,自OpenAI于2024年2月推出以来,没有其他视频生成模型能在性能或支...
3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑
这篇新智元报道介绍了一种名为3D-VLA(3D视觉-语言-动作)的新型生成式视觉-语言-行动模型,该模型在多项任务中显著提高了推理、多模态生成和规划的能力。与...
Kimi连续宕机打醒巨头!阿里百度360连夜出手长文本,大模型商业化厮杀开始了
近期,国产大模型领域掀起了一场长文本处理能力的竞赛。百度文心一言、360智脑和阿里通义千问等国内大厂纷纷宣布将升级其长文本处理能力,分别达到200万至500...
算数不行、还不懂中国文化,大模型现在抢不了设计师的饭碗! | AI 测评室
这篇文章是关于AI大模型在文生图领域的测评。作者选择了四个模型:文心一格、360智绘、美图MiracleVision 4.0和GPT-4,通过同题多解的方式,逐一测评了它们的...