图像生成

图像,绘画

拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了

  文章摘要 【关 键 词】 AI偏见、图像生成、种族刻板、性别歧视、技术论坛 在人工智能的世界里,AI偏见问题一直是一个备受关注的话题。近期,Meta...

Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话

腾讯最近开源了一个名为AniPortrait的新项目,它能够基于音频和一张参考图像生成高质量的动画人像。这个项目迅速在GitHub上获得了超过2800个星标,显示出其受...

AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝

近日,KAUST和哈佛大学的研究团队提出了MiniGPT4-Video框架,这是一个专为视频理解设计的多模态大模型。它不仅能够理解复杂视频内容,还能创作诗歌和配文,显...

如何用AI画一部武侠漫画?画完后,我沉默了。

在这篇文章中,作者分享了他利用AI技术将自己20年前写的武侠小说制作成漫画的整个过程。这个项目的起源是作者想要在春节假期期间更深入地练习和研究AI技术。...

靠“一键抠图”拿下数千万美元ARR,估值5亿美元

华纳、网飞都在使用这家法国AI初创公司的技术Photoroom是一家法国AI初创公司,专注于图像编辑技术,提供API服务,面向电商、媒体和其他用户群。该公司的技术...

免费AI“神器”系列第11弹:苹果版ChatGPT超越GPT-4;腾讯版Sora已获3000星|钛媒体AGI

生成式人工智能(AIGC)领域最近推出了多款新应用,钛媒体AGI整理了五款免费AI“神器”,每款都在其领域内展现了创新和潜力。苹果ReALM:这是一款由苹果研究团...

CVPR 2024满分论文|英伟达开源大模型FoundationPose称霸BOP排行榜

FoundationPose模型是一个用于6D物体姿态估计和跟踪的统一大模型,它能够在基于模型和无模型的设置中对新颖物体进行姿态估计和跟踪。该模型通过使用RGBD图像...

今日AGI要闻:受益于AI,全球前10大富豪身价年内增长3.6万亿;Sora或需72万块英伟达最新芯片

近日,通用人工智能(AGI)领域的发展引起了广泛关注。OpenAI公司向部分测试开发者发送了“红队网络”专家邀请邮件,寻求外部社区成员的支持以评估公司的前沿模...

李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席

李飞飞教授的计算机视觉课程CS231n在斯坦福大学再次开课,迎来了第九个年头。这门课程自2015年以来已成为计算机视觉专业学生的必修课,并见证了人工智能和计...

首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作

UC Berkeley的研究人员最近开源了首个“世界模型”(LargeWorldModel,简称LWM),这是一个在多模态任务上表现出色的模型,特别是在长视频理解方面,其性能甚至...
1 65 66 67 68 69 98