图像生成
图像,绘画
马斯克的首款多模态大模型来了,GPT-4V又被超越了一次
自2023年11月首次亮相以来,马斯克的公司在大模型领域不断取得进步,推出了,这是一个多模态模型,能够理解文本并处理文档、图表、截图和照片中的内容。Grok-...
清华大学获芯片领域重要突破!研制全球首款大规模光芯片,成果登Science
AI的进步和发展正面临着对计算芯片性能和能效的双重挑战。特别是在追求通用人工智能(AGI)的过程中,对计算设备的要求更是严苛。OpenAI的首席执行官Sam Altm...
埋头钻研一年后,阶跃星辰交出了第一份答卷
在去年的百模大战之后,大模型的落地应用逐渐成为了主流。阶跃星辰,这家初创公司虽然在去年底才浮出水面,但其背后的实力不容小觑。公司由前微软NLP专家姜大...
GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式
文章摘要 【关 键 词】 VAR、图像生成、自回归模型、扩散模型、Scaling Laws 机器之心最近发布了一篇关于新一代视觉生成范式「VAR: Visual Auto ...
剑指Sora!120秒超长AI视频模型免费开玩
近日,Picsart AI Research 团队联合发布了一款名为 StreamingT2V 的 AI 视频生成模型,该模型能够生成长达1200帧、时长为2分钟的视频,这在AI视频生成领域是...
OpenAI Sora核心作者:我们拥有的数据量足以实现AGI
文章摘要 【关 键 词】 OpenAI、Sora、视频生成、AGI、技术细节 前不久,OpenAI CEO Sam Altman 的一句话引发了业界对电影和电子游戏未来的热议...
谷歌、OpenAI、Mistral 在24小时内打响科技界“三强争霸赛”
本周,谷歌、OpenAI和Mistral在人工智能领域展开了激烈的竞争。谷歌发布了Gemini 1.5 Pro的公开预览版,这是功能最强大的生成式AI模型之一,能够处理更大的上...
CVPR 2024丨文本或图像提示精准编辑 3D 场景,美图&信工所&北航&中大联合提出 3D 编辑方法 CustomNeRF
美图影像研究院(MT Lab)联合中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了一种名为CustomNeRF的3D场景编辑方法。这项技术允许使用文本...
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
在最近的谷歌Next大会上,谷歌发布了一系列重磅产品和服务,进一步加强了其在人工智能领域的竞争力。以下是会议的主要亮点:1. Imagen 2.0的升级:谷歌推出了...
面壁智能完成数亿元新融资,华为哈勃领投,北京AI产投基金跟投|钛媒体AGI
2024年,面壁智能宣布完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。2024年,面壁智...