大模型
LLM,VLM,模型
我用半天时间,做了一个DeepSearch应用。
上周参加火山方舟的开发者见面会,让我想起 2013 年在中关村创业大街车库咖啡听讲座时的场景,怀揣梦想的开发者们挤在一起,探索尝试新的技术,然后说着自己...
奥特曼的“上帝情结”:TED创始人质疑他为何有权塑造人类未来
在温哥华 TED 2025 大会上,OpenAI 创始人山姆·奥特曼与 TED 创始人克里斯·安德森展开了一场关于 AI 技术伦理与责任的深刻对话。安德森通过竞品模型 Claude ...
复旦大学团队提出跨模态越狱防御新架构 BlueSuffix
复旦大学联合香港城市大学、新加坡管理大学的研究团队在视觉-语言模型安全防御领域取得重要进展,提出了一种基于强化微调的黑盒防御新架构——BlueSuffix。该架...
扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源
扩散模型在推理任务中的表现正逐渐受到关注,尤其是通过强化学习(RL)方法的应用。传统上,自回归大语言模型(LLM)在推理任务中占据主导地位,但离散扩散大...
微软上线两款新模型:增强RAG和AI Agent
微软在Azure AI Foundry上线了Cohere的Embed 4和Command A两款新模型,旨在增强RAG(检索增强生成)和AI Agent的功能。Embed 4是一款多模态嵌入模型,支持超...
AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据
德州大学奥斯汀分校的研究团队通过结合Transformer和离线强化学习技术,成功训练出一个能够在宝可梦对战中表现出色的AI智能体。该智能体完全依赖于人类历史对...
OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙
OpenAI最新发布的o3和o4-mini模型在编码能力上取得了显著进步,甚至在全球人类选手中位列TOP 200。然而,这些模型在生成内容时存在严重的幻觉问题,o3的幻觉...
抖音公开了他们的推荐算法原理,强烈推荐一读
抖音最近公开了其推荐算法的逻辑,揭示了如何通过机器学习预测用户行为,并实现高效的信息匹配。推荐算法的本质是一个信息过滤系统,通过分析用户的历史行为...
从数据孤岛到全链协同,这份白皮书带你走出半导体供应链困局
近年来,全球半导体市场面临多重挑战,包括晶圆厂产能紧张、车规级MCU断供等问题,导致部分车企被迫停产。供应链中断和数据孤岛成为企业发展的主要障碍,迫使...
清华张亚勤:10年后,机器人将可能比人都多
张亚勤在其新书《智能涌现》中,基于对AI技术的长期思考与实践,提出了对未来技术演进方向的深刻预判。他指出,未来10年内,机器人将逐渐进入工厂、社会,并...