图像生成
图像,绘画
AI生图大洗牌!流匹配架构颠覆传统,一个模型同时接受文本和图像输入
AI生图领域有新突破,新模型FLUX.1 Kontext可同时接受文本和图像输入,它采用流匹配架构,与此前技术不同,由Black Forest Labs推出,官方称能真正实现上下文...
AI生图迎来大升级:图像编辑达到像素级!背后团队大多来自Stable Diffusion模型基础技术发明团队
德国初创公司 Black Forest Labs(BFL)发布了名为 FLUX.1 Kontext 的全新图像生成模型,可实现图像生成和编辑,并允许添加文本及其他图像进行内容修改。模型...
多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa
近期基于扩散模型的视觉 - 语言模型 LaViDa 诞生,继承了扩散语言模型高速且可控的优点,实验表现出色。当前流行的 VLM 多基于自回归(AR)的大型语言模型(L...
巧妙!一个传统技术让国产视觉基础模型直接上大分
格灵深瞳最新发布的视觉基础模型Glint-MVT在多个领域展现了显著的技术突破。该模型通过引入间隔Softmax损失函数,显著提升了泛化能力,并在26个分类测试集中...
靠「AI婴儿播客」拿到a16z 3200万美元投资,Hedra凭什么?
Hedra,一家生成式 AI 初创公司,近期完成了 3200 万美元的 A 轮融资,由 Andreessen Horowitz(a16z)领投,总融资额达到 4400 万美元。与市场上其他生成式 ...
突发!美国新法案,10年内禁止监管AI
美国众议院近日通过了《HR1》法案,该法案将在未来10年内禁止美国各州对人工智能(AI)进行监管。这一决定对微软、OpenAI、谷歌、亚马逊等科技巨头具有重要意...
砸65亿美元招揽58岁乔布斯门生!55名苹果元老工程师尽归OpenAI,奥特曼终拿下“盯了”两年多的AI产品!
OpenAI的CEO Sam Altman宣布收购由苹果前高管Jony Ive领导的初创公司IO,交易金额高达65亿美元。此次收购主要是全股权交易,OpenAI将把IO的55名工程师和产品...
模拟芯片工程师,为何越来越吃香?
模拟IC设计工程师在台湾科技业中享有最高的非主管职年薪,中位数达到155万新台币。模拟IC(Analog Integrated Circuit)是处理连续变化电压或电流信号的晶片...
何恺明团队又发新作: MeanFlow单步图像生成SOTA,提升达50%
何恺明及其团队近期发布了一项名为MeanFlow的单步生成建模框架,该框架通过引入平均速度的概念,显著改进了现有的流匹配方法。MeanFlow在ImageNet 256×256数...
历史性时刻!Google Veo 3杀疯了,AI视频终于不再是“哑巴”
谷歌在今年的I/O大会上发布了一系列重磅AI产品,其中最引人注目的是DeepMind推出的Veo 3视频生成模型。Veo 3的突破性在于它将AI视频生成直接带入了有声时代,...