大模型
LLM,VLM,模型
哈工大发布动画多智能体,文本一键生成连贯动画
随着大规模多模态模型的兴起,AI技术在生成叙事性视频方面的应用成为研究热点。现有的方法,如MINT Video和TTT-Video,虽然在生成单个视频片段时质量有所提升...
Cache Me If You Can:陈丹琦团队如何「抓住」关键缓存,解放LLM内存?
普林斯顿大学陈丹琦团队提出统一框架解决长上下文语言模型中的KV缓存内存瓶颈问题。随着'长思维链'等技术的兴起,模型需要处理数万token的输入,导致基于Tran...
讲得了课、押得中题、学习规划还能量身定制,真卷到点子上的只有它
讯飞星火大模型X1在高考测试中表现卓越,语文作文、数学和英语分别获得国产AI中的高分排名。该模型作为科大讯飞推出的深度推理大模型,不仅支持多模态教学功...
多模态AI黑马刷榜后再造神器:一个产品搞定图片视频播客生成,自带百种特效,大牛梅涛团队出品
智象未来推出的vivago2.0是一款集成了多模态AI能力的全能创作工具,由加拿大工程院院士梅涛领衔的团队开发。该工具整合了文生图、图生视频、AI播客、特效模板...
独家 | 字节跳动机器人研究一号位孔涛离职创业
字节跳动机器人团队负责人孔涛已于6月初离职,并开始筹备自己的创业项目。孔涛于2019年7月从清华大学计算机系博士毕业,加入字节跳动后成为公司内第一位研究...
聊过 200 个团队后的暴论:不要拿 AI 造工具,要建设「新关系」
在AGI Playground 2025的演讲中,张鹏分享了他在过去三年与200多位AI领域创业者交流的观察与思考。他首先指出,当前时代的技术进步和产品创新速度极快,虽然...
LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍
最近,来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员提出了一种名为「拖拽式大语言模型」(DnD)的创新方法,能够基于提示词快速生成模型参数...
谷歌将 A2A 捐赠给 Linux 基金会,但代码实现还得靠开发者自己?!
在北美开源峰会上,Linux 基金会宣布与亚马逊云科技、思科、谷歌、微软等多家科技巨头共同成立 Agent2Agent(A2A)项目,旨在推动 AI 智能体之间的通信与协作...
沙龙预告|一场值得每一位硬件创造者关注的活动
智能硬件的“智力进化”正从实验室迅速迈向消费终端,重新定义生产力和突破场景边界。6月26日,北京中关村创业大街将举办一场聚焦“AI+硬件”前沿技术的线下沙龙...
DAC大会见证国产EDA壮大,STCO集成系统设计赋能AI新潮流
芯和半导体在2025年设计自动化大会(DAC2025)上发布了其EDA2025软件集,旨在应对人工智能技术对计算效能的指数级需求增长。该软件集定位于“STCO集成系统设计...