图像生成
图像,绘画
超强实体ChatGPT机器人:语音推理、视觉识别,“终结者”来啦!
Figure.AI联合创始人Brett Adcock发布了新一代实体机器人Figure 02,该机器人在前一代01的基础上进行了软硬件的大量更新。Figure 02搭载了6个RGB摄像头、Open...
苹果 AI 官方 prompt 泄露,看起来挺简单的
iOS 18测试版发布后,部分用户提前体验了苹果在WWDC宣布的Apple Intelligence功能。然而,在体验之前,苹果为AI功能编写的prompt指令文件被泄露。Reddit用户...
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
智谱AI于7月26日发布了国内首个人人可用的AI视频生成产品「清影」,该产品能在30秒内将任意文图生成视频。发布仅6天后,「清影」生成的视频数量就已突破百万...
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
面壁小钢炮MiniCPM-V 2.6模型以其8亿参数的规模,在端侧多模态领域取得了显著的突破。该模型在单图、多图和视频理解三个方面均达到了20亿参数以下的最佳性能...
AI画家的「滑铁卢」:为什么冰可乐不愿意住进茶杯里?
上海交通大学博士研究生赵峻图和长聘教轨助理教授王德泉的研究团队在论文《Lost in Translation: Latent Concept Misalignment in Text-to-Image Diffusion M...
中国的开源版 sora:4090 内单卡运行,A6000 可微调
智谱版Sora「清影」是一款商用级视频生成模型,于7月26日发布,能在30秒内将任意文图生成视频。该产品已在智谱AI助手「智谱清言」上线,6天内生成视频数突破...
斯坦福、Salesforce等开源1万亿tokens多模态数据集
华盛顿大学、斯坦福大学和Salesforce的研究人员联合发布了一个名为MINT-1T的多模态数据集,其规模是现有开源数据集的10倍,包含约1万亿个文本标记和34亿张图...
OpenAI 已开发 AI 文本检测工具,但担心用户流失,一直没发布
OpenAI开发了一款能够检测AI生成文本的工具,尤其针对ChatGPT生成的文本。该工具通过在文本中添加不可见的水印,并通过检测器分析文本,给出文档由ChatGPT编...
EUV光刻新方案,大幅降低成本!
本文提出了一种新型的极紫外(EUV)光刻技术,旨在降低现有EUV光刻设备的功耗和成本,同时提高生产效率。该技术采用简化的照明系统和双镜片投影物镜设计,相...
Stability.ai开源3D模型,仅需0.5秒就能快速生成
开源大模型平台Stability.ai推出了一款名为Stable Fast 3D(SF3D)的3D生成模型,该模型能够以极快的速度从图片生成高质量的3D模型。用户仅需0.5秒即可完成生...