标签:语言模型
OpenAI、Anthropic、DeepMind联手发文:现有LLM安全防御不堪一击
OpenAI、Anthropic和Google DeepMind罕见合作发表研究,揭示了当前大语言模型防御机制在自适应攻击下的系统性脆弱性。研究团队通过构建通用自适应攻击框架,...
Thinking Machines 发布 Tinker API,实现灵活的模型微调
Thinking Machines 公司推出的 Tinker API 为开放权重语言模型的微调提供了新的解决方案。该服务通过抽象化集群管理,使开发者能够通过简单的 Python 调用进...
管你模型多大,250份有毒文档统统放倒,Anthropic:LLM比想象中脆弱
黑掉一个大模型似乎比人们预期的要简单得多。传统观点认为,攻击或污染具有庞大参数量的大模型非常困难,通常需要极大量的数据污染。然而,Anthropic与英国人...
更高智商更快思考!蚂蚁开源最新万亿语言模型,多项复杂推理SOTA
蚂蚁集团正式发布其百灵大模型系列的首款旗舰产品——拥有万亿参数的通用语言模型Ling-1T。该模型在多项复杂推理基准测试中超越主流开源与闭源模型,包括DeepSe...
北京邮电大学最新研究:使用提示工程解决大模型记忆问题
北京邮电大学的研究者开发了一种免训练的提示技巧,显著提升了大型语言模型在多轮对话中的表现。该方法通过状态更新策略,使推理时间减少73.1%,令牌消耗降低...
RLHF与RLVR全都要,陈丹琦团队最新力作将推理能力拓展到通用智能
普林斯顿大学陈丹琦团队最新研究提出基于模型奖励思维的强化学习(RLMT)方法,旨在弥合专门推理能力与通用对话能力之间的差距。该方法通过将显式的思维链推...
LLM也具有身份认同?当LLM发现博弈对手是自己时,行为变化了
哥伦比亚大学与蒙特利尔理工学院的研究者 Olivia Long 和 Carter Teplica 通过研究项目,揭示了大型语言模型(LLM)在不同环境下的身份认知对其合作倾向的影...
五倍推理加速,激发自回归潜能,苹果新工作让LLM预测未来
近年来,语言模型的显著进展主要得益于大规模文本数据的可获得性以及自回归训练方法的有效性。自回归模型在训练阶段具有明显优势,但在推理阶段存在顺序执行...
香港科技大学、Manycor开源空间大模型,超3000颗星
香港科技大学与Manycore联合开源了一种名为SpatialLM的空间大模型,专注于处理3D点云数据并生成结构化的三维场景理解输出。这一模型的目标是让机器能够像人类...
新鲜出炉!斯坦福2025 CS336课程全公开:从零开始搓大模型
斯坦福大学2025年春季的CS336课程「从头开始创造语言模型」现已全面发布,课程视频和材料均可在线获取。该课程由斯坦福大学计算机科学系助理教授Tatsunori Ha...