标签:面壁智能

国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro!稳坐端侧多模态铁王座

在人工智能领域,一款仅用8B参数的端侧多模态模型引发了广泛关注。这款名为MiniCPM-Llama3-V 2.5的模型,以其卓越的性能击败了多模态巨无霸Gemini Pro和GPT-4...

26 岁带着百人团队冲刺大模型,面壁智能天才 CTO:高效比参数更重要

本文是InfoQ《大模型领航者》系列访谈的一部分,主要访谈了面壁智能CTO曾国洋,探讨了大模型技术的发展、应用以及面壁智能的公司战略和未来规划。以下是对文...

面壁智能低调开源大模型“理科状元”!LeetCode 周赛超越80%人类选手,推理性能超 Llama3-70B

面壁智能近期低调开源了一个名为Eurux-8x22B的大模型,该模型在复杂推理综合性能方面超越了Llama3-70B,成为新的开源大模型SOTA(State of the Art),并被誉...

26岁带着百人团队冲刺大模型,面壁智能天才CTO:高效比参数更重要

本文是对《大模型领航者》访谈的详细总结,访谈由极客邦科技创始人兼CEO霍太稳主持,嘉宾为面壁智能CTO曾国洋。文章主要围绕面壁智能的发展历程、大模型技术...

中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹

面壁智能,一家源自清华大学的创业公司,近期在大语言模型领域取得了显著进展。该公司致力于优化语言模型,以提高效率并降低成本。今年2月,面壁智能发布了第...

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

面壁智能团队在大模型领域的探索与实践面壁智能团队,由曾国洋担任CTO,自2020年GPT-3发布后开始训练大模型,逐渐认识到提升模型效果是大模型训练的根本目标...

专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮

文章介绍了面壁智能发布的两个大模型:MiniCPM 2B和OmniLMM。MiniCPM 2B被称为'小钢炮',在规模大小和性能上超越了Mistral-7B等大模型,展示了端侧大语言模型...

梭哈大模型的公司,给自己找了条退路

面壁智能最近发布了其旗舰端侧AI大模型MiniCPM-2B,这是一个拥有20亿参数的模型,它使用了1TB的精选数据进行训练。在多项主流评测榜单上,MiniCPM-2B的表现超...