大模型

LLM,VLM,模型

逐字生成非最优?试试逐「块」生成!Block Diffusion打通了自回归与扩散

扩散模型在生成图像和视频方面取得了显著进展,并在处理离散数据(如文本或生物序列)方面展现出潜力。与自回归模型相比,扩散模型具有加速生成和提高输出可...

驯服AI,更懂物理!何恺明团队提出全新DHN「去噪哈密顿网络」

何恺明团队提出的去噪哈密顿网络(DHN)将哈密顿力学融入神经网络,突破了传统局部时间步的限制,并通过独特的去噪机制在物理推理任务中表现出色。传统机器学...

Nature:你的大脑衰老速度受这64个基因影响

科学家们通过利用AI模型分析大量脑部扫描和遗传数据,确定了64个影响大脑衰老速度的基因,并指出了13种潜在的抗衰老药物。这项研究发表在《Science Advances...

仅剩1席!抢占AI展区最后黄金展位,与全球巨头同台竞技!

2025慕尼黑上海电子展的“人工智能联合展区”即将开幕,仅剩一个黄金展位,吸引了众多顶尖半导体企业的关注。该展区旨在通过展示AI芯片、边缘计算、智能终端等...

超级Agent,鸣枪起跑

夸克的超级Agent具备意图理解、任务规划和自主执行三大核心特征,它通过阿里强大的推理模型和多模态技术,将丰富的工具和服务转化为智能模块,能够弹性组合,...

挑战主流观点!卡耐基梅隆大学最新研究表明:仅靠压缩即可实现 AI 解谜能力

卡耐基梅隆大学的研究人员 Issac Liao 和 Albert Gu 提出了一种新的方法,通过信息压缩来解决复杂的推理任务,挑战了传统机器学习系统依赖大量预训练数据的观...

Manus带火的MCP,让Claude一句话自动化3D建模,网友:真·AI+应用

Claude通过BlenderMCP项目实现了将2D图片自动转换为3D建模的功能,这一过程无需人工干预,仅需一次提示词即可完成。BlenderMCP项目基于MCP(Model Context Pr...

CVPR 2025:长Prompt对齐问题也能评估了!当前最大AIGC评估数据集,模型评分超越当前SOTA

CVPR 2023年共收到13008份有效投稿,最终录用2878篇,录用率为22.1%。多模态相关内容仍然是今年研究的重点。上海交通大学-美团计算与智能联合实验室的论文被...

被DeepSeek刺激完的VC们,终于让自己忙起来了

DeepSeek对中国创投圈的冲击远比ChatGPT更为猛烈和实际。2025年初,一级市场的动向显示,随着DeepSeek需求的爆发,AI基础设施(AI Infra)公司纷纷宣布新的融...

破解国产芯片FP8及DeepSeek部署难题,清华团队开源“赤兔Chitu”大模型引擎

清华大学高性能计算研究所翟季冬教授团队与清程极智联合宣布开源大模型推理引擎“赤兔Chitu”,该引擎首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运...
1 67 68 69 70 71 590