图像生成
图像,绘画
苹果开源通用视觉模型:创新训练方法,超1000颗星
苹果公司的研究团队最近发布了一款名为AIMv2的通用多模态视觉模型,该模型具有300M、600M、1.2B和2.7B四种参数规模,并且整体能耗低,使其能够适应手机、PC等...
阿里开源版Sora上线即屠榜,4070就能跑,免费商用
阿里巴巴近期开源了一款名为Wan 2.1的视频生成模型,拥有14B参数量,凭借其卓越的性能在VBench上超越了Sora和Gen-3等竞争对手。该模型在处理复杂运动细节方面...
今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布
OpenAI最近宣布其强大的智能体Deep Research已经向所有ChatGPT Plus、Team、Edu和Enterprise用户开放,最初只有Pro用户可以访问。同时,OpenAI发布了Deep Res...
何恺明ResNet级神作,分形生成模型计算效率狂飙4000倍!清华校友一作
何恺明团队最近提出了一种名为「分形生成模型」的新型AI图像生成技术,该技术通过模拟自然界中的分形现象,实现了高分辨率逐像素建模,并显著提升了计算效率...
何恺明开辟分形图像生成新范式!计算效率提高4000倍,首次实现高分辨率逐像素生成
何恺明团队近期在生成模型领域取得了重大突破,提出了一种名为分形生成模型(Fractal Generative Models)的全新范式。该模型首次实现了逐像素生成高分辨率图...
中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”!
Anthropic正式发布Claude 3.7 Sonnet模型,该模型作为市场首个混合推理系统,允许用户通过标准模式和扩展思考模式灵活控制模型的响应速度与思考深度。标准模...
顺为、朱啸虎入局,LiblibAI 一年完成四轮融资
AI图像生成平台LiblibAI宣布在成立一年内完成四轮融资,累计金额达数亿元,创下国内AI应用赛道融资速度纪录。最新两轮融资由渶策资本、顺为资本领投,明势创...
DeepSeek们正在颠覆美妆圈
在一家头部美妆企业的实验室中,跨学科团队正通过AI技术重新定义美的表达方式。虚拟试妆镜、皮肤检测仪、AI定制配方和3D生物打印面膜等技术已实现规模化应用...
人刚毕业,代码一点不会,他纯靠ChatGPT写APP,年入千万美金
Blake Anderson通过ChatGPT开发多款高收入应用的经历,展现了AI工具在技术门槛降低与商业创新中的潜力。2023年5月,面临经济困境的Blake在无编程基础的情况下...
YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世
YOLOv12通过引入创新的注意力机制和结构优化,显著提升了实时目标检测的性能与效率。该模型由纽约州立大学布法罗分校和中国科学院大学的研究团队联合开发,旨...