图像生成
图像,绘画
融合ChatGPT+DALL·E 3,贾佳亚团队新作开源畅玩:识图推理生图一站解决
这篇文章介绍了香港中文大学终身教授贾佳亚团队提出的多模态模型Mini-Gemini,该模型整合了GPT-4和DALL·E 3的能力,具有强大的图像解析推理和生成能力。Mini-...
生图超级外挂!贾佳亚团队提出 VLM 模型 Mini-Gemini,堪比 GPT4+DALLE3 王炸组合
香港中文大学终身教授贾佳亚团队提出了一款名为Mini-Gemini的多模态模型,该模型结合了更高清图像的精确理解、更高质量的训练数据以及更强的图像解析推理能力...
文本直接生成多视角3D图像,Meta推出创新模型
该文章介绍了一个专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的平台。文章提到了文生图领域...
清华首款AI光芯片登上Science,全球首创架构迈向AGI
清华大学的研究团队开发了一种名为「太极」的AI光芯片,这是一种使用光而非电来处理数据的新型芯片。这项技术的亮点在于其高效的能源利用,「太极」芯片的能...
杨立昆:目标驱动AI才是未来
杨立昆是Meta首席AI科学家,他在Meta AI Day上提出了一个与主流看法截然不同的观点:生成式AI存在局限,并展望了AI未来发展方向为目标驱动AI系统。生成式AI虽...
免费AI “神器”第十四弹:Sora竞品可生成2分钟视频;谷歌Vlogger能让图像说话 | 钛媒体AGI
本文介绍了近期生成式人工智能(AIGC)领域涌现的五款创意十足的新应用。首先是由Picsart AI Research、UT Austin和Shi Labs共同开发的120秒超长AI视频模型St...
人在B站,要被AI公司们挤爆了
随着人工智能技术的快速发展,AI大模型公司们已经将营销战场转移到了社交媒体平台,尤其是以年轻用户为主的B站。这些公司通过各种创新的广告投放方式,如视频...
刷爆多模态任务榜单!贾佳亚团队Mini-Gemini登热榜,代码、模型、数据全部开源
这篇文章介绍了由香港中文大学终身教授贾佳亚团队提出的多模态模型 Mini-Gemini,被称为绝绝子,相当于开源社区的 GPT4+DALLE3 的王炸组合。Mini-Gemini提供...
北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token
这篇文章介绍了北大和字节跳动合作开发的新方法——Visual Autoregressive Modeling(VAR),旨在改进图像生成的质量和效率。VAR采用了预测下一级分辨率的方式...
AI手机的未来,苹果和谷歌选择走同一条路
苹果公司近期发布了一篇论文,介绍了名为Ferret UI的新模型,这标志着智能手机操作系统可能迎来重大变革。Ferret UI模型基于苹果的Ferret多模态模型,特别擅...