图像生成

图像,绘画

复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持

模型信息 【模型公司】 月之暗面 【模型名称】 moonshot-v1-32k 【摘要评分】 ★★★★★   文章摘要 【关 键 词】 机器之心、Sora、多模态、AnyGPT...

CVPR 2024满分论文:浙大提出基于可变形三维高斯的高质量单目动态重建新方法

摘要:本文介绍了一种基于光栅化的单目动态场景建模pipeline,由浙江大学和字节跳动的研究团队提出。该方法通过结合变形场和3D高斯,实现了高质量的动态场景...

2张图2秒钟3D重建!这款AI工具火爆GitHub,网友:忘掉Sora

DUSt3R是一个令人兴奋的新工具,它能够仅通过两张图片,无需任何额外数据测量,快速生成一个完整的3D小熊模型。这个工具在GitHub上迅速走红,成为热榜第二。...

谷歌创始人亲自救场Gemini现身黑客聚会,投资人逼宫CEO劈柴哥下台

在一场AI黑客马拉松活动中,谷歌联合创始人布林现身并发表了演讲。他分享了关于修复Gemini大模型bug的经验,并讨论了AGI和AI对社会的影响。布林对Gemini在种...

文生图平台ideogram获8000万美元,并发布1.0版本

专注于AIGC领域的专业社区,跟踪微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。文生图平台ideogram.ai宣布获得8000万美元A轮融...

机器人再度大幅进化!阿西莫夫三法则还有效吗?| 大模型一周大事

在本周的大模型行业动态中,InfoQ 研究中心为我们带来了一系列令人兴奋的进展。英国 Engineered Arts 的 Ameca、特斯拉的 Optimus 和 Sanctuary AI 的 Phoeni...

7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力

新智元报道了一项关于图推理的研究,该研究由香港科技大学和南方科技大学的研究团队进行。他们证实了视觉图(Visual Graph)在图推理中的作用,并发现它可以...

谢尔盖·布林狠批Gemini「搞砸了」!51岁创始人回归,CEO劈柴或将下台?

摘要:谷歌联合创始人谢尔盖·布林在AGI House举办的Gemini黑客松上公开承认了Gemini在图像生成方面的失误,并表示其回归谷歌是因为AI的快速发展。这一事件引...

谷歌承认了!Gemini 完全搞砸了!

文章主要介绍了谷歌的Gemini AI引擎近期因生成一系列多元化的纳粹图像而引发的公众关注和担忧。谷歌CEO桑达尔·皮查伊对此表示严厉警告,强调这类错误是绝不允...

一张草图直接生成视频游戏,谷歌推出生成交互大模型

本文介绍了谷歌DeepMind推出的首个无需数据标记、无监督训练的生成交互模型——Generative Interactive Environments(简称“Genie”)。Genie拥有110亿参数,能...
1 69 70 71 72 73 88