图像生成
图像,绘画
Hello GPT-4o
OpenAI最近推出了其最新的旗舰模型GPT-4o,这是一个跨音频、视觉和文本的全能模型,代表了自然人机交互的重大进步。GPT-4o能够接收和输出文本、音频和图像的...
除了一键启动Copilot,什么是AI PC本来该有的样子?
在过去一年多的时间里,人工智能(AI)技术的快速发展已经开始深刻地影响着我们的生活和工作方式。特别是在个人电脑(PC)领域,AI技术的应用正在推动一场新...
美国教授用2岁女儿训AI模型登Science!人类幼崽头戴相机训练全新AI
这篇文章报道了纽约州立大学心理学家Brenden Lake教授的一项研究,他通过让女儿Luna头戴相机收集数据,来探索如何更有效地训练人工智能(AI)模型,特别是大...
一线创业者圆桌讨论:多模态 AI 的创业机会在于「有用」
产品人的AI观点:1. 用户在使用AI图像/视频生成产品时,更关注可控性和成本。专业用户倾向于使用SD WebUI/ComfyUI工作流,而普通用户则更多使用MidJourney等...
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
本文报道了基于Diffusion Transformer(DiT)的新模型Flag-DiT,该模型由上海AI Lab、港中文和英伟达的研究者联合推出,旨在通过流(Flow-based)的大型扩散T...
中山大学与联想团队发布 ConsistentID,单张照片即可成为百变超人
图像生成技术的最新进展,特别是基于扩散的文本到图像模型,已经极大地推动了个性化和定制化肖像生成的发展。这些技术在电子商务广告、个性化礼物定制和虚拟...
国产大模型:今天起,我们100万tokens只需1元!
智谱AI,一家国内的大模型开发商,近期在顶级会议ICLR上作为特邀演讲嘉宾后,紧接着宣布了其大模型开放平台的价格调整:1元人民币可兑换1000000 tokens,这一...
OpenAI重磅更新定档下周一,奥特曼暗示会有「魔法」!
OpenAI即将在下周一(13日)上午10点(太平洋时间)进行线上直播,届时将展示全新的ChatGPT demo演示和GPT-4升级更新。尽管之前有关于GPT-5和搜索引擎的传闻...
OpenAI大招要来了!AI语音助手狙击谷歌苹果,官宣下周二上新,GPT-5年前见
OpenAI宣布将在直播中展示ChatGPT和GPT-4的更新内容,同时外媒报道OpenAI正在开发具备音频和视觉理解能力的AI语音助手,部分功能已向客户展示。OpenAI可能在...
投资大佬炮轰谷歌一半员工是摆设!AI 工程师:我们被招来后净做没用的东西了
本文讨论了硅谷大型科技公司在AI领域的竞争现状,以及这种竞争对员工工作负担和公司文化的影响。文章引用了多位业内人士的观点,包括Andreessen Horowitz的Da...