大模型
LLM,VLM,模型
DeepSeek精度效率双提升,华为&信工所提出思维链“提前退出”机制
华为与中科院信工所合作提出了一种名为DEER(动态提前退出推理)的新方法,旨在解决大模型在长思维链推理中可能出现的过度思考问题。DEER的核心在于找到推理...
微软开源新版ph4:媲美DeepSeek-R1,参数暴降48倍
微软近期在官网开源了三个新版Phi-4小参数模型,分别是Reasoning、Min-Reasoning和Reasoning-plus。这些模型的最大亮点之一是算力消耗极低,能够在消费级硬件...
2025,我们又一次用AI,交了个朋友。
在2025年5月10日的杭州,一场别开生面的AI聚会如期举行。这次活动吸引了来自全国各地的300名参与者,场地选在了阿里园区内的一个巨大篮球场,既满足了人数需...
红杉资本年度分享:应用层才是价值高地,下一阶段是Agent
红杉资本在AI Ascent 2025年度大会上,三位核心合伙人Pat Grady、Sonya Huang和Konstantine Buhler分享了他们对AI创业市场的深刻洞察和未来预测。大会的核心...
独家对话百图生科张晓明:未来5-10年,AI制药产业有望迎来爆发期|钛媒体AGI
新药研发是技术研究中风险最高、耗时最长的领域之一,平均投入约26亿美元,耗时12-15年,但成功率低于10%。传统药物研发依赖经验和反复试验,探索化学空间庞...
AI 线下实战公开课(广州场)来啦!2.5小时 解锁 AI 大模型 MCP 开发核心技能
首场AI线下实战课于5月24日下午在广州黄埔区举行,聚焦AI大模型的MCP开发协议,旨在通过深度知识剖析与实战演练,帮助参与者掌握这一关键技术。MCP开发协议在...
解密NVIDIA团队的代理式AI技术实践
在数字化转型的背景下,代理式AI(Agentic AI)作为前沿技术,正在成为企业提升效率和优化决策的关键工具。NVIDIA团队通过多个实践展示了代理式AI在不同场景...
下周聊:大模型进入 RL 下半场,模型评估为什么重要?
随着大模型技术进入发展的下半场,如何重新定义问题并设计真实用例的评估体系成为关键议题。OpenAI Agent Researcher姚顺雨的博客文章《The second half》引...
国家级AI赛事报名开启!全球精英同台竞技近20个热点赛题,大奖等你拿
第二届「兴智杯」全国人工智能创新应用大赛于5月8日正式开幕,主题为「兴智赋能,创新引领」。作为国内规模最大、参赛主体最丰富的AI专业赛事品牌,「兴智杯...
KuaiMod来了!快手用大模型重构短视频生态格局
短视频已成为现代用户日常生活中不可或缺的一部分,不仅是娱乐方式,更是信息获取、观点表达和社交构建的主要媒介。随着短视频内容的爆炸式增长,平台面临着...