图像生成
图像,绘画
GPT-4o模仿人类声音,诡异尖叫引OpenAI研究员恐慌!32页技术报告出炉
OpenAI的GPT-4o模型在经过一系列安全测试后,其语音功能因存在潜在风险而迟迟未能上线。该模型在高背景噪声环境下可能模仿用户声音,且在特定提示下可能发出...
欺诈层出不穷,AI与大模型如何助力金融机构应对挑战?
随着AI技术的快速发展,金融领域正面临前所未有的挑战,尤其是在智能风控方面。AI攻击的成本几乎为零,同时伴随着生成式AI技术的发展,如AI换脸、AI换声等,...
谷歌发布大模型数据筛选方法:效率提升13倍,算力降低10倍
在AIGC领域,大语言模型(LLM)的发展和应用落地对训练数据的需求日益增长。然而,现有的数据处理流程依赖人工筛选,成本高昂且效率低下。谷歌Deepmind的研究...
思特威正式发布子品牌飞凌微,首发产品定位智驾视觉处理
思特威(SmartSens,股票代码688213)近日宣布成立全资子公司飞凌微电子(Flyingchip™),并发布了飞凌微M1车载视觉处理芯片系列。该系列包括M1(Camera ISP...
超强实体ChatGPT机器人:语音推理、视觉识别,“终结者”来啦!
Figure.AI联合创始人Brett Adcock发布了新一代实体机器人Figure 02,该机器人在前一代01的基础上进行了软硬件的大量更新。Figure 02搭载了6个RGB摄像头、Open...
苹果 AI 官方 prompt 泄露,看起来挺简单的
iOS 18测试版发布后,部分用户提前体验了苹果在WWDC宣布的Apple Intelligence功能。然而,在体验之前,苹果为AI功能编写的prompt指令文件被泄露。Reddit用户...
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
智谱AI于7月26日发布了国内首个人人可用的AI视频生成产品「清影」,该产品能在30秒内将任意文图生成视频。发布仅6天后,「清影」生成的视频数量就已突破百万...
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
面壁小钢炮MiniCPM-V 2.6模型以其8亿参数的规模,在端侧多模态领域取得了显著的突破。该模型在单图、多图和视频理解三个方面均达到了20亿参数以下的最佳性能...
AI画家的「滑铁卢」:为什么冰可乐不愿意住进茶杯里?
上海交通大学博士研究生赵峻图和长聘教轨助理教授王德泉的研究团队在论文《Lost in Translation: Latent Concept Misalignment in Text-to-Image Diffusion M...
中国的开源版 sora:4090 内单卡运行,A6000 可微调
智谱版Sora「清影」是一款商用级视频生成模型,于7月26日发布,能在30秒内将任意文图生成视频。该产品已在智谱AI助手「智谱清言」上线,6天内生成视频数突破...