图像生成

图像,绘画

百度AI,终于对搜索下手了

百度和Google在AI搜索领域的策略有所不同。百度采取了渐进式变革,逐步用AI改造搜索,AI生成的搜索结果占比从10%逐步涨到35%,但大部分仍作为传统蓝色链接的...

干翻 GPT-4V 的面壁 8B「小钢炮」,被Nature 收录了

清华大学与面壁智能团队在边缘设备上成功实现了多模态大模型的落地,推出了MiniCPM-V系列模型,该系列包括MiniCPM-V 1.0、MiniCPM-V 2.0和MiniCPM-Llama3-V 2...

Altman嘲讽小扎挖走的都不是顶尖人才!OpenAI高管再营业曝内幕:ChatGPT爆红后,我火速升职了!

在AI领域竞争日益激烈的背景下,Meta和OpenAI之间的AI人才争夺战成为焦点。Meta首席执行官马克·扎克伯格近期宣布成立超级智能团队,并成功招募了多位OpenAI的...

我们用世界名画和Meme“拷打”了智谱9B的视觉推理模型,结果出人意料

2025年上半年,AI开源领域的竞争聚焦于效率提升、多模态能力和智能体开发三大方向。参数规模不再是唯一追求,如何通过架构创新和训练方法优化实现“小模型强性...

跟着Google出海:教你怎么落地Gemini

Founder Park 与 Google 合作推出的「从模型到行动」系列 AI 工作坊,旨在帮助开发者将顶尖 AI 模型的能力转化为实际商业价值。该系列工作坊将在深圳、上海和...

开源端到端语音大模型:直接从原始音频输入,生成语音输出

Step-Audio团队近期开源了一个端到端的语音大模型Step-Audio-AQAA,该模型能够直接理解音频输入并生成自然流畅的语音回答,而无需先将语音转换为文本。这一技...

95后,边改造业务边发AI顶会论文,是怎样的体验?

在AI时代的浪潮下,顶尖技术人才的市场价值被推升至前所未有的高度。无论是谷歌Transformer论文八子,还是从OpenAI出走的科学家,他们的选择直接影响企业技术...

文心大模型 4.5 系列正式开源,涵盖 10 余款模型

百度于6月30日正式开源了文心大模型4.5系列,涵盖10款不同参数规模的模型,包括47B、3B激活参数的混合专家(MoE)模型和0.3B参数的稠密型模型。这些模型已在...

强化学习也能预训练?效果可提升20倍,华人新作引爆RL新范式!

大规模预训练和微调的模式在机器学习领域取得了显著成功,但在强化学习(RL)中的应用仍面临挑战。强化学习需要对时间和意图进行推理,传统方法在处理长时间...

拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩

阿里最新发布的多模态模型Qwen-VLo在图像生成和编辑领域展现了强大的能力,引发了广泛关注。该模型在原有的多模态理解和生成能力基础上进行了全面升级,具备...
1 5 6 7 8 9 139