图像生成
图像,绘画
突发,OpenAI CTO离职
OpenAI的首席技术官(CTO)Mira Murati宣布将离开公司,结束了她六年半的任职。在X平台上发表的离职声明中,Murati表达了对公司及其团队的感激之情,并强调了...
最强 AR 眼镜 + 最受欢迎开源 AI,Meta 大会小扎赢麻了
在2024年的Meta Connect大会上,扎克伯格迟到了15分钟,但他的迟到并没有影响新品发布的重磅程度。会上,Meta推出了多款新品,包括更便宜的Quest 3S系列、Met...
李飞飞创业之后首个专访:视觉空间智能与语言一样根本
李飞飞教授与联合创始人Justin Johnson在a16z的专访中分享了他们对AI领域新研究前沿——空间智能的看法。李飞飞强调,空间智能与语言一样根本,是AI发展的关键...
谷歌发布新RL方法,性能提升巨大,o1模型已证明
在AIGC领域,大语言模型(LLM)的自我纠错能力一直是研究的重点。谷歌DeepMind的研究人员开发了一种名为SCoRe的多轮强化学习方法,旨在提升大模型在数学和代...
IBM开源新模型,可完美、快速转换PDF文档格式
在AIGC领域,PDF文档的转换一直是一个技术挑战,因为PDF文件在格式、标准化和结构上存在显著差异。IBM的研究人员开发了Docling模型,这是一个基于PDF解析器、...
Jeff Dean回忆谷歌趣事:吴恩达激励自己继续研究,Hinton曾是最强「实习生」
Jeff Dean,谷歌的AI领域资深专家,自1999年加入谷歌以来,一直是公司在人工智能和机器学习领域的领军人物。他参与创立了Google Brain团队,并在2021年荣获IE...
政企向大模型转身,阿里云十年打磨一把「锤」
阿里云致力于将大模型技术应用于政企领域,以提升其数字化转型的效率和安全性。2023年4月,大模型技术首次被引入陕煤建新煤矿等矿山,通过实时采集图像和环境...
阿里发布AI生视频模型:通义万相走出了自己的“中国风”特色!
在云栖大会上,阿里巴巴展示了其最新的人工智能视频生成模型——通义万相。这是一款全自研的视觉生成大模型,采用Diffusion + Transformer架构,支持图像和视频...
阿里国际发布最新版多模态大模型Ovis,拿下开源第一
阿里国际AI团队最近发布了一款名为Ovis的多模态大模型,该模型在图像理解任务上取得了显著进展,多项子类任务达到了SOTA(最新技术)水平。多模态大模型相较...
阿里通义万相AI生视频震撼上线!更懂中国风的大模型来了
阿里巴巴集团近期推出了一款名为通义万相的AI视频生成工具,该工具在阿里云栖大会上由CTO周靖人宣布正式上线。通义万相AI视频功能专为中国市场设计,能够理解...