标签:图像生成
中山大学与联想团队发布 ConsistentID,单张照片即可成为百变超人
图像生成技术的最新进展,特别是基于扩散的文本到图像模型,已经极大地推动了个性化和定制化肖像生成的发展。这些技术在电子商务广告、个性化礼物定制和虚拟...
北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token
这篇文章介绍了北大和字节跳动合作开发的新方法——Visual Autoregressive Modeling(VAR),旨在改进图像生成的质量和效率。VAR采用了预测下一级分辨率的方式...
算数不行、还不懂中国文化,大模型现在抢不了设计师的饭碗! | AI 测评室
这篇文章是关于AI大模型在文生图领域的测评。作者选择了四个模型:文心一格、360智绘、美图MiracleVision 4.0和GPT-4,通过同题多解的方式,逐一测评了它们的...
发完最后一篇论文,Stable Diffusion核心团队全要离职了
Stability AI,一家成立于2019年的AI初创公司,近期面临了重大的人事变动和投资者信心丧失的困境。该公司即将失去主要技术负责人Robin Rombach,他是文生图模...
哪里要动点哪里!腾讯联合清华、港科大推出全新图生视频大模型
文章介绍了一个新的图像生成视频模型 Follow-Your-Click,由腾讯混元、清华大学和香港科技大学联合推出。这个模型可以让静态的图像区域动起来,只需在照片中...
万字梳理:阿里、腾讯等8家中国互联网大厂的50款大模型及应用,能否全面超越GPT-4? | 钛媒体AGI
自OpenAI推出ChatGPT以来,全球科技巨头纷纷加速布局AI大模型领域。钛媒体AGI整理了2023年以来,包括阿里巴巴、百度、字节跳动、腾讯、华为等在内的8家科技公...
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
机器之心专栏机器之心编辑部近期报道了Meta开源的LLaMA架构在大型语言模型(LLM)中的成功应用,以及最新研究成果VisionLLaMA的进展。VisionLLaMA是一种旨在实...
谷歌创始人承认AI搞砸了,CEO或辞职
谷歌的新人工智能工具Gemini在图像生成功能上出现了严重的白人偏见问题,引发了公众争议。联合创始人布林承认了问题的存在,并表示公司在图像生成方面确实出...
文生图平台ideogram获8000万美元,并发布1.0版本
专注于AIGC领域的专业社区,跟踪微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。文生图平台ideogram.ai宣布获得8000万美元A轮融...