GPT-GPTs
GPT,GPTs,Prompt
阿德莱德大学吴琦:VLN 仍是 VLA 的未竟之战丨具身先锋十人谈
视觉-语言-导航(VLN)和视觉-语言-动作(VLA)是近年来具身智能领域的重要研究方向。2018年,吴琦与Peter Anderson、Abhishek Das首次将视觉-语言(VL)与机...
被《经验时代》刷屏之后,剑桥博士长文讲述RL破局之路
强化学习(RL)与大型语言模型(LLM)的结合在2025年展现了巨大的潜力,尤其是在后训练时代。RL通过其在策略优化和创造力方面的优势,证明了其与LLM的互补性...
8大主流AI Agent平台深度测评:哪款最值得入手?| 赠书福利
AI Agent(人工智能代理)是一种能够感知环境、自主理解、决策并执行动作的智能体,具备通过独立思考调用工具实现目标的能力。与依赖提示词交互的大模型不同...
刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦
OpenAI于今日凌晨发布了全新的图像生成模型GPT-image-1,并通过API向全球开发者开放使用。该模型与ChatGPT版本有显著不同,具备多项高级功能,包括控制生成图...
想吞下 Chrome 的 OpenAI,要做数字世界的「唯一入口」
OpenAI近期在反垄断调查中表现出对Google Chrome浏览器的强烈兴趣,并公开表示如果Google被迫分拆Chrome,OpenAI将参与竞购。OpenAI的ChatGPT产品负责人尼克·...
Cursor、Devin 等爆款系统提示词曝光,Github上斩获近 2.5 万颗星!官方给 AI 工具“洗脑”:你是编程奇才
近日,Github 上出现了一个开源项目,揭示了多个 AI 工具的完整 System Prompt 和内部工具,包括 Cursor、Devin、Manus 等。这些 System Prompt 是对话开始前...
突发!OpenAI或将收购谷歌浏览器Chrome
今天凌晨,路透社报道了OpenAI一位高管在谷歌垄断案庭审中作证的消息,透露OpenAI可能收购谷歌的浏览器Chrome。目前,谷歌正在美国面临反垄断审判,若上诉失...
字节跳动开源多模态AI Agent—UI-TARS-1.5
字节跳动开源了多模态AI Agent UI-TARS的最新1.5版本,该版本在多个基准测试中表现出色,展现了其强大的通用性和扩展能力。在计算机使用方面,UI-TARS-1.5在O...
突发!OpenAI将收购谷歌浏览器Chrome
今天凌晨,路透社报道了OpenAI一位高管在谷歌垄断案庭审中作证的消息,透露OpenAI可能收购谷歌的浏览器Chrome。这一消息引发了广泛关注,因为谷歌目前正面临...
港科、北交、复旦等提出针对 VLM 的大规模预训练对抗攻击 AnyAttack | CVPR 2025
近年来,视觉语言模型(VLMs)在多模态AI领域展现了重要的研究价值和应用潜力,但其安全性问题也逐渐受到关注。传统对抗攻击方法依赖预设标签,难以适应大规...