标签:多模态

仅1/70的数据量,多模态检索效果却更优! 智源发布BGE-VL,合成数据立大功

智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了BGE系列模型的生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最...

智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

智源研究院联合多所高校发布了多模态向量模型BGE-VL,该模型通过独创的MegaPairs合成数据技术,在图文检索、组合图像检索等任务中取得了显著成果。BGE-VL的发...

全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

由UCLA等机构组成的研究团队在全球首次实现了在20亿参数的非监督微调模型上进行多模态推理的突破,这一成果被称为DeepSeek-R1的「啊哈时刻」。研究团队在未经...

微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队

微软发布Phi-4系列两款新型模型——Phi-4-multimodal和Phi-4-mini,标志着小型语言模型(SLM)领域的重大突破。Phi-4-multimodal作为微软首个多模态模型,集成...

微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B

微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员,标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...

苹果开源通用视觉模型:创新训练方法,超1000颗星

苹果公司的研究团队最近发布了一款名为AIMv2的通用多模态视觉模型,该模型具有300M、600M、1.2B和2.7B四种参数规模,并且整体能耗低,使其能够适应手机、PC等...

“大模型六虎”阶跃星辰3月将开源图生视频模型|钛媒体AGI

在首届Step UP生态开放日上,阶跃星辰公布了多项技术进展与战略规划。创始人姜大昕强调,公司正通过多模态与推理能力双轮驱动,推进AGI技术路线。今年3月将开...

放大招!文心一言「全面免费」,同时开启「深度搜索」,抢鲜实测!

2025年初,大模型领域的竞争进入新阶段,百度文心大模型宣布将于4月1日起全面免费开放,用户可体验最新模型及超长文档处理、专业检索增强等多项功能。此举与O...

文心一言全面免费了,深度搜索功能同时上线,第一手实测在此

百度宣布自4月1日起全面免费开放文心一言模型,覆盖PC端和APP端用户,同步推出深度搜索功能。该功能通过推理模型与搜索技术结合,支持复杂问题的专业级解答,...

Sam Altman炸场东京,亲曝GPT-5研发路线图,多模态能力颠覆传统

OpenAI联合创始人兼首席执行官Sam Altman在东京大学的活动中分享了关于GPT模型的未来发展计划。GPT-5将是一个超级混合模型,整合GPT和o系列模型,支持视频、...
1 2 3 4 5 27