大模型
LLM,VLM,模型
李想「不想造车」的背后,其实是想造「司机 Agent」
李想近期公开了理想汽车在智能化领域的重大进展,尤其是全新推出的VLA(Vision-Language-Action)模型,标志着理想汽车在智能驾驶领域的进一步突破。VLA模型...
OpenAI野心爆棚!启动全球版“星际之门”,首批10个国家
OpenAI宣布了一项名为“OpenAI for Countries”的新计划,旨在为全球各国提供AI基础设施支持,并推广“民主的AI”理念。这一计划源于今年1月与特朗普总统及合作伙...
字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%
字节跳动最近开源了一种新的图像编辑方法,名为SuperEdit,该方法在性能上比当前最先进的图像编辑方法提高了9.19%,同时仅使用了1/30的训练数据和1/13的模型...
大模型AI应用,正在企业级赛道迅猛爆发
大模型AI应用在消费级市场的爆发引发了广泛关注,但企业级大模型AI应用市场的潜力同样不容忽视。这一领域的需求明确且增长迅猛,AI、云计算和企业服务领域的...
Pokee.ai 朱哲清:用 RL 搭建智能体的「骨骼与神经」| AI 产品十人谈
朱哲清是一位坚定的强化学习(RL)信仰者,他早在2016年AlphaGo击败李世石时便意识到AI的潜力,并开始深入研究RL。尽管RL在随后的几年中经历了低谷,朱哲清始...
爆火的 AI 玩具赛道,全行业都在等一个「成功者」
近年来,AI玩具创业成为众多年轻人追逐的热点,尤其是在社交媒体和科技展会上,AI玩具相关话题和产品吸引了大量关注。许多创业者希望通过打造具备情感陪伴功...
关于 AI 编程的最本质提问:Cursor 到底有没有护城河?
Cursor作为一款AI驱动的代码编辑器,凭借其独特的产品体验和用户粘性,迅速在开发者工具市场中占据了一席之地。其核心优势在于以AI-first的方式构建,深度集...
一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二
基于文本指令的图像编辑任务一直是图像生成和编辑领域的热点,近年来随着Gemini、GPT-4o等商业大模型的推出,这一领域的技术水平不断提升。然而,传统方法通...
碾压Cursor?谷歌突发Gemini 2.5 Pro 预览版,编码能力全网第一
谷歌在年度I/O开发者大会前夕,发布了Gemini 2.5 Pro Preview(I/O版),这是其旗舰AI模型的升级版本。该模型在多项主流基准测试中表现优异,特别是在编程和W...
Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7
谷歌最新发布的Gemini 2.5 Pro Preview(I/O版)在多个领域取得了显著突破,尤其是在编程、视觉和文本处理方面表现卓越。该模型在LMeana基准测试中斩获三连冠...