大模型
LLM,VLM,模型
20万美元商业级视频生成大模型Open-Sora 2.0来了,权重、推理代码及训练流程全开源!
潞晨科技推出的 Open-Sora 2.0 是一款开源的 SOTA 视频生成模型,标志着视频生成领域的开源革命。该模型仅用 20 万美元(224 张 GPU)成功训练出商业级 11B ...
OpenAI的全新Agent开发工具,想把Agent生态全抓在自己手里
OpenAI近期发布了一系列新的API平台功能,旨在推动下一代AI应用开发的标准。其中,Responses API的引入尤为关键,它提供了构建Agent的模块,帮助开发者实现搜...
从放弃的AI浏览器到通用Agent:完整复盘 Manus的诞生过程
肖弘是一位连续创业者,其团队擅长从0到1的创业阶段,但在从1到N的扩展过程中面临挑战。2023年,他的新公司「蝴蝶效应」推出了一款名为Monica.im的浏览器插件...
新科研神器!这回读英文论文真跟读中文没两样了
翻译软件与大模型的结合,正在推动翻译领域的深刻变革。与通用大模型相比,翻译软件在垂直领域的语料积累和系统工程方面具有独特优势。百度翻译通过多年的技...
字节AI高管骆怡航任清华系公司生数科技CEO,原CEO发文:人生就是不停地告别|钛媒体AGI
原字节跳动AI高管骆怡航近日加入清华系AI视频公司生数科技,担任CEO一职,全面负责公司研发、产品、商业化及团队管理工作。生数科技表示,骆怡航的加入将为公...
高阶智驾“破壁人”来了:13万标配激光雷达,还能「车位到车位」
零跑最新推出的紧凑级SUV B10,以12.98万元的预售价格,将高阶智能驾驶技术推向了一个新的普及高度。这款车型标配了激光雷达、200TOPS+算力、端到端智驾模型...
谷歌开源Gemma-3:媲美DeepSeek,算力暴降10倍
谷歌CEO Sundar Pichai宣布开源最新多模态大模型Gemma-3,该模型主打低成本高性能,共有10亿、40亿、120亿和270亿四种参数版本。即便最大的270亿参数版本,仅...
小红书基于 PPO 的多模态大模型 RLHF 系统的设计与优化
随着大模型技术从技术变革转向产业变革,传统基础设施技术已无法满足大模型应用的快速发展需求,整个基础设施技术和产业链正在向大模型基础设施技术转型。多...
OpenAI新Agent套件全解析,以及发布会没说的30+要点
OpenAI在凌晨1点发布了全新的Agent开发套件,旨在简化复杂Agent系统的构建和管理。该套件包含四个核心组件:Responses API、内置工具、Agents SDK和监控工具...
总结下我的Cursor使用经验
高效使用 Cursor 构建 Golang 项目的关键在于建立良好的编辑和测试循环。这一循环的核心在于让 AI 生成代码、编写测试用例并执行测试,根据测试结果修正错误...