图像生成
图像,绘画
正在和DeepSeek-V3-0324做个大项目,「氛围编程」简直太疯狂了
氛围编程(Vibe coding)是由AI领域知名专家Andrej Karpathy提出的概念,其核心在于用户仅需通过自然语言描述即可生成代码。这一概念在短短一个多月内迅速风...
网上晒图要当心!AI六成可能知道你在哪儿
AI在图像地理识别任务中表现出色,准确率远超人类,但也暴露了显著的偏差和隐私问题。 研究表明,视觉语言模型(VLMs)能够通过图像细节推断地理位置,表现最...
AIGC第一股年报详解:AIGC业务暴涨88.5%营收2.2亿,95%智能硬件交付出海,跑通规模化「软件订阅+出海」
出门问问在2024年发布了其上市后的首份年度财报,展示了其在AIGC领域的显著进展和商业化成果。AIGC业务营收突破2.2亿元,同比增长88.5%,成为公司的主要增长...
吉卜力只是开胃小菜,GPT-4o一键抠图「换装换背景」!推理也初步显现
OpenAI的GPT-4o模型近期成为AI领域的热门话题,尤其是在图像生成和推理能力方面的表现引发了广泛关注。通过GPT-4o,用户能够生成吉卜力风格的图像和视频,甚...
智源研究院院长王仲远:至少5-10年,具身智能模型才能成熟落地|钛媒体AGI
在2025中关村论坛年会的“未来人工智能先锋论坛”上,智源研究院院长王仲远发布了跨本体具身大小脑协作框架RoboOS和开源具身大脑RoboBrain。这两款技术产品旨在...
“计算机视觉被GPT-4o终结了”(狗头)
GPT-4o原生多模态图像生成技术的出现,标志着计算机视觉领域的一次重大突破。该技术不仅能够生成高质量的图像,还具备语义分割、深度图生成等复杂功能,甚至...
迈向群体智能 | 智源发布首个跨本体具身大小脑协作框架与开源具身大脑
在2025中关村论坛“未来人工智能先锋论坛”上,智源研究院发布了跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain,旨在推动单机智能向群体智能的跃迁。...
AI跨本体组队!智源发布首个跨本体具身大小脑协作框架+开源具身大脑
在2025中关村论坛上,智源研究院发布了跨本体具身大小脑协作框架RoboOS和开源具身大脑RoboBrain,标志着单机智能向群体智能的迈进。RoboOS通过模块化设计和智...
「AIGC第一股」出门问问交上完美答卷:营收破2.2亿,同比增长88.5%
在生成式AI领域,出门问问作为“AIGC第一股”,凭借其2024年度财报的亮眼表现引发了业内广泛关注。财报显示,公司2023年总收入达3.9亿元,同比增长6%,其中AIGC...
《连线》杂志长文:疯狂追赶OpenAI的2年,谷歌都做了什么?
谷歌在人工智能领域的追赶历程,尤其是与OpenAI的竞争,成为了近年科技界的重要话题。自OpenAI推出ChatGPT以来,谷歌面临着前所未有的压力。ChatGPT虽然存在...