标签:新智元

「有效上下文」提升20倍!DeepMind发布ReadAgent框架

ReadAgent的设计灵感来源于人类的交互式阅读方式,它通过一个简单的提示系统实现,利用LLMs的高级语言功能。这个系统包括三个主要部分:决定哪些内容存储在记...

AI下一个重大飞跃是理解情感!第一个具有情商的对话型AI来了

新智元报道了一家名为Hume AI的初创公司,该公司发布了一款被称为「第一个具有情商的对话式人工智能」的共情语音接口(EVI),它能够检测到53种不同的情绪。H...

GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动

新智元报道了关于OpenAI即将发布的GPT-5的最新动态。据报道,OpenAI已经向一些用户发送了红队测试的邀请邮件,这表明GPT-5可能已经进入红队测试阶段。红队测...

CVPR 2024满分论文|英伟达开源大模型FoundationPose称霸BOP排行榜

FoundationPose模型是一个用于6D物体姿态估计和跟踪的统一大模型,它能够在基于模型和无模型的设置中对新颖物体进行姿态估计和跟踪。该模型通过使用RGBD图像...

马斯克放弃自动驾驶?特斯拉CV负责人被曝离职,马斯克急澄清

【新智元导读】特斯拉的计算机视觉负责人Ethan Knight最近离职,加入了马斯克的另一家公司xAI。这一事件引发了外界对特斯拉自动驾驶技术发展的担忧,但马斯克...

首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作

UC Berkeley的研究人员最近开源了首个“世界模型”(LargeWorldModel,简称LWM),这是一个在多模态任务上表现出色的模型,特别是在长视频理解方面,其性能甚至...

音乐ChatGPT 2.0来了!AI作曲家被踢馆,亲测周杰伦爆款大翻车

Stability AI最近发布了Stable Audio 2.0,一款能够创作长达3分钟的音乐作品的AI音乐工具。这个工具可以通过简单的自然语言指令或音频输入,生成高质量、结构...

OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!

Anthropic最新研究揭示了大型语言模型(LLM)的一个重大安全漏洞,称为多样本越狱(Many-shot jailbreaking,MSJ)。这种攻击方法利用了LLM的长上下文窗口,...

普林斯顿首个「开源」AI程序员登场!爆改GPT-4,93秒修bug

普林斯顿大学的研究团队最近推出了一个名为SWE-agent的全新开源智能体-计算机接口(ACI),这是一个基于GPT-4的AI程序员,能够在GitHub仓库中自动修复bug。SW...

谷歌挖走OpenAI大将!前开发者关系负责人官宣加盟

在最近的一则新闻中,OpenAI前开发者关系负责人Logan Kilpatrick正式加入了谷歌。这一事件在业界引起了广泛关注,被视为AI人才争夺战的一个重要标志。Logan K...
1 2 3 4 5 18