图像生成

图像,绘画

半数员工年薪超164万,打工人最向往的公司

在当今世界,OpenAI和英伟达是两家备受瞩目的公司。OpenAI开发了三个颠覆性产品,其中包括ChatGPT,这是一款智能聊天机器人,能够根据用户提供的文字描述提供...

一句话让图片动起来,苹果发力大模型动画生成,可直接编辑结果

苹果公司最新研发的AI工具Keyframer,能够通过文本描述将静态图像转化为动画。这项技术利用了大型语言模型(LLM)的代码生成能力,允许用户通过自然语言提示...

复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持

模型信息 【模型公司】 月之暗面 【模型名称】 moonshot-v1-32k 【摘要评分】 ★★★★★   文章摘要 【关 键 词】 机器之心、Sora、多模态、AnyGPT...

CVPR 2024满分论文:浙大提出基于可变形三维高斯的高质量单目动态重建新方法

摘要:本文介绍了一种基于光栅化的单目动态场景建模pipeline,由浙江大学和字节跳动的研究团队提出。该方法通过结合变形场和3D高斯,实现了高质量的动态场景...

2张图2秒钟3D重建!这款AI工具火爆GitHub,网友:忘掉Sora

DUSt3R是一个令人兴奋的新工具,它能够仅通过两张图片,无需任何额外数据测量,快速生成一个完整的3D小熊模型。这个工具在GitHub上迅速走红,成为热榜第二。...

谷歌创始人亲自救场Gemini现身黑客聚会,投资人逼宫CEO劈柴哥下台

在一场AI黑客马拉松活动中,谷歌联合创始人布林现身并发表了演讲。他分享了关于修复Gemini大模型bug的经验,并讨论了AGI和AI对社会的影响。布林对Gemini在种...

文生图平台ideogram获8000万美元,并发布1.0版本

专注于AIGC领域的专业社区,跟踪微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。文生图平台ideogram.ai宣布获得8000万美元A轮融...

机器人再度大幅进化!阿西莫夫三法则还有效吗?| 大模型一周大事

在本周的大模型行业动态中,InfoQ 研究中心为我们带来了一系列令人兴奋的进展。英国 Engineered Arts 的 Ameca、特斯拉的 Optimus 和 Sanctuary AI 的 Phoeni...

7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力

新智元报道了一项关于图推理的研究,该研究由香港科技大学和南方科技大学的研究团队进行。他们证实了视觉图(Visual Graph)在图推理中的作用,并发现它可以...

谢尔盖·布林狠批Gemini「搞砸了」!51岁创始人回归,CEO劈柴或将下台?

摘要:谷歌联合创始人谢尔盖·布林在AGI House举办的Gemini黑客松上公开承认了Gemini在图像生成方面的失误,并表示其回归谷歌是因为AI的快速发展。这一事件引...
1 55 56 57 58 59 74