标签:多模态

「群体智能」剑指AGI革命!国产架构挑战Transformer霸权,首款非Attention模型更新

国内AI初创团队RockAI提出了一种新的方法来实现通用人工智能(AGI),即通过“群体智能”来赋予每个设备智能,并实现类人交互。他们认为,要实现这一目标,需要...

后发先至,字节版 Sora 发布!10秒长度、多主体交互、一致性多镜头

字节跳动公司近期发布了豆包大模型的多款新品,标志着其在人工智能领域的进一步拓展。这些新品包括视频生成、音乐生成和同声传译大模型,展示了公司在AI视频...

万字推演OpenAI o1 self-play RL 技术路线

曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习(RL)模型o1,该模型在数理推理领域取得了显著成绩,并提出了训练时计算(train-time compute)和测...

阿里国际发布最新版多模态大模型Ovis,拿下开源第一

阿里国际AI团队最近发布了一款名为Ovis的多模态大模型,该模型在图像理解任务上取得了显著进展,多项子类任务达到了SOTA(最新技术)水平。多模态大模型相较...

新SOTA来了:国产9B模型多项得分超4o-mini,中国出海电商已经用上了

阿里巴巴国际AI团队最近开源了一款名为Ovis1.6的多模态大模型,该模型在多模态领域的权威评测基准OpenCompass上取得了显著成绩,超越了其他主流开源模型,如Q...

门板上做研究的首席科学家:Jeff Dean 解密谷歌和 Gemini 背后的故事​

谷歌首席科学家Jeff Dean在谷歌的职业生涯中,见证了公司从一个小规模的搜索引擎发展成为全球科技巨头。他始终坚守着谷歌的使命:组织全球信息,使其普遍可用...

任意论文一键变播客,谷歌正式发布Illuminate,它能重构研究者的学习方式吗?

谷歌推出了一款名为Illuminate的创新产品,旨在通过人工智能技术改变研究者的学习方式。Illuminate能够将学术论文转化为AI生成的音频讨论,使得用户能够以听...

视觉模型底座超越OpenAI,格灵深瞳开启多模态落地的Scaling Law

在大模型时代,如何将这些技术落地并实现产业应用成为了业界关注的焦点。中国公司格灵深瞳在这一领域取得了显著成就,其多模态大模型在多个权威数据集上的表...

全新GPT-4o mini发布!大模型杀疯了!

OpenAI近期发布了GPT-4o,这是继GPT-4之后的新一代多模态AI模型,标志着人工智能技术的又一次重大进步。这一发展强调了掌握大模型、多模态、LangChain、Fine-...

商汤生成式AI收入超10亿元,同比增长256%

商汤科技集团在2024年上半年的财报中显示,公司总营收达到17.4亿人民币,同比增长21.4%。其中,生成式AI业务收入显著增长,达到10.5亿元,同比增长256%,占总...
1 2 3 13