图像生成
图像,绘画
IBM开源新模型,可完美、快速转换PDF文档格式
在AIGC领域,PDF文档的转换一直是一个技术挑战,因为PDF文件在格式、标准化和结构上存在显著差异。IBM的研究人员开发了Docling模型,这是一个基于PDF解析器、...
Jeff Dean回忆谷歌趣事:吴恩达激励自己继续研究,Hinton曾是最强「实习生」
Jeff Dean,谷歌的AI领域资深专家,自1999年加入谷歌以来,一直是公司在人工智能和机器学习领域的领军人物。他参与创立了Google Brain团队,并在2021年荣获IE...
政企向大模型转身,阿里云十年打磨一把「锤」
阿里云致力于将大模型技术应用于政企领域,以提升其数字化转型的效率和安全性。2023年4月,大模型技术首次被引入陕煤建新煤矿等矿山,通过实时采集图像和环境...
阿里发布AI生视频模型:通义万相走出了自己的“中国风”特色!
在云栖大会上,阿里巴巴展示了其最新的人工智能视频生成模型——通义万相。这是一款全自研的视觉生成大模型,采用Diffusion + Transformer架构,支持图像和视频...
阿里国际发布最新版多模态大模型Ovis,拿下开源第一
阿里国际AI团队最近发布了一款名为Ovis的多模态大模型,该模型在图像理解任务上取得了显著进展,多项子类任务达到了SOTA(最新技术)水平。多模态大模型相较...
阿里通义万相AI生视频震撼上线!更懂中国风的大模型来了
阿里巴巴集团近期推出了一款名为通义万相的AI视频生成工具,该工具在阿里云栖大会上由CTO周靖人宣布正式上线。通义万相AI视频功能专为中国市场设计,能够理解...
新SOTA来了:国产9B模型多项得分超4o-mini,中国出海电商已经用上了
阿里巴巴国际AI团队最近开源了一款名为Ovis1.6的多模态大模型,该模型在多模态领域的权威评测基准OpenCompass上取得了显著成绩,超越了其他主流开源模型,如Q...
互联网已经被 AI 污染的差不多了
在当前互联网环境中,AI生成内容(AIGC)的泛滥正成为一个日益严重的问题。从社交媒体到搜索引擎,从音乐平台到电子书市场,AI生成的内容无处不在,且往往难...
OpenAI押注的「1X」训出专用世界模型,首证机器人Scaling Law
1X公司,一家挪威人形机器人制造商,最近推出了NEO Beta,一款专为家庭设计的双足人形机器人。该公司由OpenAI领投,专注于开发高仿真人形机器人NEO和商用轮式...
这款 AI 相机,让你「读懂」自己毛孩子的心
随着宠物在现代家庭中的地位日益提升,宠物沟通师这一职业应运而生,他们声称能够与宠物进行跨物种沟通,以了解宠物的需求。然而,这一职业的有效性尚未得到...