图像生成

图像,绘画

Meta发布多模态模型Chameleon:34B、类GPT-4o、性能接近GPT-4V

在多模态人工智能领域,GPT-4o 的问世开创了一个新纪元,被称为首个“原生”多模态模型,因其能无缝融合文本、视觉和音频。区别于传统多模态模型采用的特定模态...

国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro!稳坐端侧多模态铁王座

在人工智能领域,一款仅用8B参数的端侧多模态模型引发了广泛关注。这款名为MiniCPM-Llama3-V 2.5的模型,以其卓越的性能击败了多模态巨无霸Gemini Pro和GPT-4...

大模型进入「实用」时代!腾讯助力「销冠」量产,5 分钟创建智能助手

在本文中,作者介绍了英伟达CEO黄仁勋的观点,他认为计算机编程将不再是必要的技能,因为未来的技术将使得人们不再需要编程。文章讨论了腾讯云生成式AI产业应...

谷歌数学版Gemini破解奥赛难题,堪比人类数学家!

在谷歌I/O大会上, Gemini 1.5 Pro的发布引起了广泛关注。该模型的数学专业版本在多项基准测试中展现出了卓越性能,特别是数学能力,其成绩甚至与人类专家水...

Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA

Chameleon模型挑战了OpenAI的GPT-4o,成为首个敢于与之一较高下的新模型。Chameleon采用统一的Transformer架构,能够在单一神经网络中无缝处理文本和图像,通...

谷歌发布文生图模型Imagen 3,写实效果超强!

在谷歌的'I/O2024'大会上,推出了全新的文生图片模型——Imagen3。该模型在理解文本提示方面表现卓越,能够捕捉长文本中的细微细节,并且在生成图片的嵌入文字...

腾讯混元文生图大模型开源:Sora 同架构,更懂中文

腾讯最近开源了其混元文生图大模型,这是一个业内首个中文原生的 DiT(扩散模型与 Transformer)架构的文生图开源模型,具备中英文双语输入及理解的能力。混元...

开源模型穷途末路?Stability AI欠下1亿美元,四处找钱寻求「卖身」

Stability AI,一度估值达10亿美元的独角兽公司,正面临财务危机,考虑出售公司。尽管其推出的Stable Diffusion 3模型在图像生成领域取得了显著的成果,超越...

英特尔打破40年“祖制”的CPU,AI PC们来验收成果了

搭载英特尔® 酷睿™ Ultra处理器的AI PC展现出显著提升的生产力。用户仅需通过语音命令即可调整电脑设置和执行复杂任务,如打开文件、静音以及将性能调至高性...

大模型应用门槛:→0

混元大模型升级:腾讯混元大模型通过腾讯云,面向企业和开发者开放了多种尺寸的模型服务,如hunyuan-pro、hunyuan-standard和hunyuan-lite。hunyuan-standard...
1 2 3 47