图像生成
图像,绘画
首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作
UC Berkeley的研究人员最近开源了首个“世界模型”(LargeWorldModel,简称LWM),这是一个在多模态任务上表现出色的模型,特别是在长视频理解方面,其性能甚至...
CVPR 2024 | 更高效、更准确的拖拽编辑 Drag Your Noise
何盛烽团队与华南师范大学合作,在CVPR 2024上发表了一项创新的研究成果《Drag Your Noise: Interactive Point-based Editing via Diffusion Semantic Propag...
AIGC还是二刺猿会玩:捏娃社区爆火,有脑洞就能当同人大佬
捏Ta:一个AI驱动的二次元创作平台捏Ta是一个结合了AI生成内容(AIGC)技术的二次元创作平台,它允许用户即使没有绘画基础也能创造出自己心中的角色。这个平...
ChatGPT现在能帮你P图了,只需简单说几个字
OpenAI的DALL-E 3在AI图像编辑领域迈出了重要一步,通过与ChatGPT的集成,用户现在可以在网页、iOS和安卓版的ChatGPT中使用DALL-E的强大图像编辑功能。这项更...
CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法
物体姿态估计是机器人操纵和混合现实等应用领域的关键技术。传统的实例级方法依赖于纹理CAD模型生成训练数据,但无法适用于未见过的新物体;而类别级方法虽然...
英伟达AI新课爆火!免费学习,干货满满
英伟达的黄院士宣布推出一系列免费的AI课程,这些课程覆盖了从数据科学到深度学习,再到生成式AI的多个领域。这些课程不仅包含录制的视频,还提供了讲义、PPT...
前沿|斯坦福大学把脉医疗AI,介绍了10个创新场景
斯坦福大学在人工智能(AI)领域的贡献不容小觑,特别是在医疗保健、研究和教育方面。近年来,斯坦福大学教授李飞飞等华人科学家在AI领域的活跃表现,更是引...
突发!200多名欧美音乐人联名反对滥用 AI 侵权|钛媒体AGI
近年来,随着人工智能技术的飞速发展,AI在音乐创作领域的应用引发了广泛关注。然而,这一技术的进步也带来了争议,尤其是在版权和艺术家报酬方面。2023年4月...
AIGC应用与开发@硅创社AIGC3月图书推荐榜
硅创社于3月推出了以'AIGC+应用开发'为主题的新书推荐榜,共推荐了12本AIGC新书,旨在帮助职场人士提高工作效率。这些书籍涵盖了AIGC技术在多个领域的应用,...
80M参数打平GPT-4!苹果发超强上下文理解模型,聪明版Siri马上就来
苹果公司最近发布了一款名为ReALM的新型AI模型,这款模型仅需80M参数即可实现对各种形式上下文的理解,包括屏幕解析、多轮对话和上下文引用等。ReALM的推出旨...