图像生成

图像,绘画

阿里通义万相AI生视频震撼上线!更懂中国风的大模型来了

阿里巴巴集团近期推出了一款名为通义万相的AI视频生成工具,该工具在阿里云栖大会上由CTO周靖人宣布正式上线。通义万相AI视频功能专为中国市场设计,能够理解...

新SOTA来了:国产9B模型多项得分超4o-mini,中国出海电商已经用上了

阿里巴巴国际AI团队最近开源了一款名为Ovis1.6的多模态大模型,该模型在多模态领域的权威评测基准OpenCompass上取得了显著成绩,超越了其他主流开源模型,如Q...

互联网已经被 AI 污染的差不多了

在当前互联网环境中,AI生成内容(AIGC)的泛滥正成为一个日益严重的问题。从社交媒体到搜索引擎,从音乐平台到电子书市场,AI生成的内容无处不在,且往往难...

OpenAI押注的「1X」训出专用世界模型,首证机器人Scaling Law

1X公司,一家挪威人形机器人制造商,最近推出了NEO Beta,一款专为家庭设计的双足人形机器人。该公司由OpenAI领投,专注于开发高仿真人形机器人NEO和商用轮式...

这款 AI 相机,让你「读懂」自己毛孩子的心

随着宠物在现代家庭中的地位日益提升,宠物沟通师这一职业应运而生,他们声称能够与宠物进行跨物种沟通,以了解宠物的需求。然而,这一职业的有效性尚未得到...

马斯克盯上了盲人,Neuralink下一代脑机接口产品获批

Neuralink公司开发的大脑植入芯片Blindsight最近获得了美国食品药品监督管理局(FDA)的“突破性设备认定”,这一认定通常授予那些在临床显著性方面相较于现有...

麻省理工创新模型:用2D视频扩散,生成 3D 视频

在传统的3D视频生成领域,存在两种主要方法:一种是依赖2D视频模型和静态3D场景模型的分类器来优化动态3D视频场景的表示,这种方法对计算资源的需求极高,生...

MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答

新智元报道了多模态大型语言模型(MLLMs)在多学科多模态理解和推理(MMMU)基准测试中的最新进展。尽管这些模型在排行榜上的表现不断提升,但对其是否真正理...

3 个月 9 次升级,可灵 AI 进化到什么程度了?

备受瞩目的「草莓大模型」o1正式发布,预示着大模型领域的竞争将更加激烈。与此同时,视频生成领域的「卷王」可灵AI也迎来了其1.5版本的内测,这一新模型在图...

李飞飞任CEO,空间智能公司World Labs亮相,全明星阵容曝光

斯坦福大学计算机科学家李飞飞宣布创立AI初创公司World Labs,该公司专注于向AI系统传授物理现实知识,以解决空间智能问题。李飞飞认为空间智能是AI领域中难...
1 46 47 48 49 50 121