图像生成
图像,绘画
微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队
微软发布Phi-4系列两款新型模型——Phi-4-multimodal和Phi-4-mini,标志着小型语言模型(SLM)领域的重大突破。Phi-4-multimodal作为微软首个多模态模型,集成...
微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员,标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...
苹果开源通用视觉模型:创新训练方法,超1000颗星
苹果公司的研究团队最近发布了一款名为AIMv2的通用多模态视觉模型,该模型具有300M、600M、1.2B和2.7B四种参数规模,并且整体能耗低,使其能够适应手机、PC等...
阿里开源版Sora上线即屠榜,4070就能跑,免费商用
阿里巴巴近期开源了一款名为Wan 2.1的视频生成模型,拥有14B参数量,凭借其卓越的性能在VBench上超越了Sora和Gen-3等竞争对手。该模型在处理复杂运动细节方面...
今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布
OpenAI最近宣布其强大的智能体Deep Research已经向所有ChatGPT Plus、Team、Edu和Enterprise用户开放,最初只有Pro用户可以访问。同时,OpenAI发布了Deep Res...
何恺明ResNet级神作,分形生成模型计算效率狂飙4000倍!清华校友一作
何恺明团队最近提出了一种名为「分形生成模型」的新型AI图像生成技术,该技术通过模拟自然界中的分形现象,实现了高分辨率逐像素建模,并显著提升了计算效率...
何恺明开辟分形图像生成新范式!计算效率提高4000倍,首次实现高分辨率逐像素生成
何恺明团队近期在生成模型领域取得了重大突破,提出了一种名为分形生成模型(Fractal Generative Models)的全新范式。该模型首次实现了逐像素生成高分辨率图...
中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”!
Anthropic正式发布Claude 3.7 Sonnet模型,该模型作为市场首个混合推理系统,允许用户通过标准模式和扩展思考模式灵活控制模型的响应速度与思考深度。标准模...
顺为、朱啸虎入局,LiblibAI 一年完成四轮融资
AI图像生成平台LiblibAI宣布在成立一年内完成四轮融资,累计金额达数亿元,创下国内AI应用赛道融资速度纪录。最新两轮融资由渶策资本、顺为资本领投,明势创...
DeepSeek们正在颠覆美妆圈
在一家头部美妆企业的实验室中,跨学科团队正通过AI技术重新定义美的表达方式。虚拟试妆镜、皮肤检测仪、AI定制配方和3D生物打印面膜等技术已实现规模化应用...