大模型

LLM,VLM,模型

谷歌、微软加入「AI 操控电脑」战场:谷歌版贾维斯将由Gemini 2.0加持

科技巨头们正将AI智能体操控电脑屏幕作为未来发展的重点。Anthropic展示了Claude 3.5能够自主看屏幕操作光标完成复杂任务。谷歌正在开发名为“Project Jarvis”...

OpenAI董事会主席新AI Agent公司获12亿元,估值320亿

Sierra AI,由OpenAI董事会主席Bret Taylor和前谷歌AI实验室负责人Clay Bavor共同创立,已完成1.75亿美元融资,公司估值达到45亿美元。该公司专注于利用OpenA...

推出 AI 耳机,字节真正的野心是什么?

字节跳动豆包推出了AI智能体耳机Ola Friend,这款开放式耳机以其轻巧设计和与豆包大模型及App的深度结合而引人注目。用户通过简单的语音命令即可激活耳机,实...

陶哲轩神预言!Transformer破解百年三体难题,凭数学直觉找到李雅普诺夫函数

Meta研究者发现,Transformer模型能够解决132年前提出的数学难题——发现全局李雅普诺夫函数。这一发现被发表在NeurIPS 2024上,引起了AI社区的广泛关注。全局...

谷歌AI播客刚火,Meta就开源了平替,效果一言难尽

谷歌和Meta两大科技巨头近日在AI播客领域动作频频,引发业界关注。上个月,谷歌宣布对其AI笔记应用NotebookLM进行重大更新,新增了生成YouTube视频和音频文件...

Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型了

清华大学物理系的特奖得主姚顺宇,以其在凝聚态物理领域的突破性贡献而闻名,包括首次提出非厄米系统的拓扑能带理论,并定义了两个新的物理概念。他的研究成...

先让不懂代码的来测?通义这个新产品,代码刚写完,预览就出来了

阿里巴巴旗下的通义公司推出了一款名为“代码模式”的AI代码工具,旨在简化应用开发流程,降低编程门槛。该工具允许用户通过自然语言描述需求,AI模型实时生成...

让 AI 从「语言智能」进化到「现实智能」,这家手机公司想得最透彻

荣耀MagicOS 9.0的发布标志着智能手机向真正“有灵魂”的全场景AI操作系统的转变。该系统通过大模型技术,增强了AI的主动感知能力,使其能够更精准地理解用户需...

一张显卡看遍天下电影!智源联合高校开源Video-XL打破长视频理解极限,95%准确率刷爆纪录

智源研究院联合国内多所顶尖高校推出了超长视频理解大模型Video-XL,这一模型在处理小时级视频上展现了卓越的性能和泛化能力。Video-XL利用语言模型的原生能...

一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源

智源研究院联合多所高校发布了超长视频理解大模型Video-XL,该模型利用语言模型的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力,还在长视频理...
1 27 28 29 30 31 391