图像生成
图像,绘画
复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持
模型信息 【模型公司】 月之暗面 【模型名称】 moonshot-v1-32k 【摘要评分】 ★★★★★ 文章摘要 【关 键 词】 机器之心、Sora、多模态、AnyGPT...
CVPR 2024满分论文:浙大提出基于可变形三维高斯的高质量单目动态重建新方法
摘要:本文介绍了一种基于光栅化的单目动态场景建模pipeline,由浙江大学和字节跳动的研究团队提出。该方法通过结合变形场和3D高斯,实现了高质量的动态场景...
2张图2秒钟3D重建!这款AI工具火爆GitHub,网友:忘掉Sora
DUSt3R是一个令人兴奋的新工具,它能够仅通过两张图片,无需任何额外数据测量,快速生成一个完整的3D小熊模型。这个工具在GitHub上迅速走红,成为热榜第二。...
谷歌创始人亲自救场Gemini现身黑客聚会,投资人逼宫CEO劈柴哥下台
在一场AI黑客马拉松活动中,谷歌联合创始人布林现身并发表了演讲。他分享了关于修复Gemini大模型bug的经验,并讨论了AGI和AI对社会的影响。布林对Gemini在种...
文生图平台ideogram获8000万美元,并发布1.0版本
专注于AIGC领域的专业社区,跟踪微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。文生图平台ideogram.ai宣布获得8000万美元A轮融...
机器人再度大幅进化!阿西莫夫三法则还有效吗?| 大模型一周大事
在本周的大模型行业动态中,InfoQ 研究中心为我们带来了一系列令人兴奋的进展。英国 Engineered Arts 的 Ameca、特斯拉的 Optimus 和 Sanctuary AI 的 Phoeni...
7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力
新智元报道了一项关于图推理的研究,该研究由香港科技大学和南方科技大学的研究团队进行。他们证实了视觉图(Visual Graph)在图推理中的作用,并发现它可以...
谢尔盖·布林狠批Gemini「搞砸了」!51岁创始人回归,CEO劈柴或将下台?
摘要:谷歌联合创始人谢尔盖·布林在AGI House举办的Gemini黑客松上公开承认了Gemini在图像生成方面的失误,并表示其回归谷歌是因为AI的快速发展。这一事件引...
谷歌承认了!Gemini 完全搞砸了!
文章主要介绍了谷歌的Gemini AI引擎近期因生成一系列多元化的纳粹图像而引发的公众关注和担忧。谷歌CEO桑达尔·皮查伊对此表示严厉警告,强调这类错误是绝不允...
一张草图直接生成视频游戏,谷歌推出生成交互大模型
本文介绍了谷歌DeepMind推出的首个无需数据标记、无监督训练的生成交互模型——Generative Interactive Environments(简称“Genie”)。Genie拥有110亿参数,能...