图像生成
图像,绘画
AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说rap
摘要总结:阿里推出了一款名为EMO的基于音频驱动的肖像视频生成框架,引起了广泛关注。用户只需提供一张参考图像和一段音频,即可生成表情生动的AI视频。这项...
吐槽完 Sora,Google自己做的“基础世界模型”来了
Google DeepMind推出了名为「Genie」的人工智能模型,这是一个能够根据用户提示生成交互式视频游戏的AI。Genie可以将合成图像、真实照片、手绘草图或想法转换...
Llama 3被爆7月解禁剑指GPT-4,最大参数超1400亿!2名核心团队成员却离职
新智元报道:据外媒报道,Meta计划在7月发布Llama 3,这是一个开源大模型,预计将具有超过1400亿参数,性能将远超Llama 2。Llama 3将解除一些限制,能更好地...
中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻
摘要:OpenAI研究员Jason Wei将Sora视频生成模型比作视频领域的GPT-2,预示着视频生成技术的新时代。Sora能够创作出具有艺术感和逼真度的短视频,尽管还不能...
谷歌CEO承认其人工智能完全搞砸了
谷歌近期遭遇了一起由Gemini AI引擎生成的多元化纳粹图片引发的公关危机。这一事件引发了公众的关注和不满,因为这种做法不仅缺乏审美品位,还历史事实不准确...
速递 | 刚刚敲定!AI图像Photoroom估值5亿美金,融资4300万美金,专注自研大模型
Photoroom,一家总部位于巴黎的人工智能照片编辑应用公司,以其惊人的增长速度吸引了大量在线商务和休闲用户。近日,该公司成功完成了最新一轮融资,估值达到...
商汤全球首创「日日新SenseNova 4.0」惊天大模型!彻底颠覆你的AI体验
近日,中国人工智能企业商汤宣布推出全球首个多模态大型模型“日日新SenseNova 4.0”。该模型能同时处理文本、图像、音频等不同形式的数据,并在多项任务上超越...
字节跳动正秘密研发多个AI产品
摘要:界面新闻报道称,字节跳动正在AI大模型领域秘密研发多个产品,包括多模态数字人产品以及AI生图、AI生视频产品等。据悉,字节跳动旗下剪映已组建封闭团...
Text Inversion: 比 Lora 更简单地训练人脸【Stable Diffusion 炼丹教程】
本文详细介绍了如何使用Text Inversion方法训练Stable Diffusion模型,使其能够生成特定的人物图像。文章首先解释了Text Inversion的基本概念和优势,然后逐...
文生视频模型“卷”出新天际;多家手机厂商AlI in Al,终端AI时代来临?| 大模型一周大事
在过去一周,大模型行业迎来了多项重要进展。OpenAI发布的视频生成产品Sora成为焦点,预示着AI在视频制作领域的重大突破。Sora的发布不仅降低了视频制作的门...