标签:面壁智能
端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前
苹果公司即将举行的发布会备受期待,但更引人注目的是苹果在端侧AI领域的新进展,即Apple Intelligence。端侧AI正成为科技巨头的新战场,谷歌、苹果和OpenAI...
WAIC 最具技术想象力成果发布:新架构面壁小钢炮又一次验证并加速了面壁定律
2020年,1750亿参数规模的GPT-3模型问世,其训练成本高昂,需要使用1000张英伟达A100 GPU,花费81.6万美元,耗时22天。然而,到了2024年,只需2B参数规模的大...
国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro!稳坐端侧多模态铁王座
在人工智能领域,一款仅用8B参数的端侧多模态模型引发了广泛关注。这款名为MiniCPM-Llama3-V 2.5的模型,以其卓越的性能击败了多模态巨无霸Gemini Pro和GPT-4...
26 岁带着百人团队冲刺大模型,面壁智能天才 CTO:高效比参数更重要
本文是InfoQ《大模型领航者》系列访谈的一部分,主要访谈了面壁智能CTO曾国洋,探讨了大模型技术的发展、应用以及面壁智能的公司战略和未来规划。以下是对文...
面壁智能低调开源大模型“理科状元”!LeetCode 周赛超越80%人类选手,推理性能超 Llama3-70B
面壁智能近期低调开源了一个名为Eurux-8x22B的大模型,该模型在复杂推理综合性能方面超越了Llama3-70B,成为新的开源大模型SOTA(State of the Art),并被誉...
26岁带着百人团队冲刺大模型,面壁智能天才CTO:高效比参数更重要
本文是对《大模型领航者》访谈的详细总结,访谈由极客邦科技创始人兼CEO霍太稳主持,嘉宾为面壁智能CTO曾国洋。文章主要围绕面壁智能的发展历程、大模型技术...
中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
面壁智能,一家源自清华大学的创业公司,近期在大语言模型领域取得了显著进展。该公司致力于优化语言模型,以提高效率并降低成本。今年2月,面壁智能发布了第...
被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
面壁智能团队在大模型领域的探索与实践面壁智能团队,由曾国洋担任CTO,自2020年GPT-3发布后开始训练大模型,逐渐认识到提升模型效果是大模型训练的根本目标...
专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮
文章介绍了面壁智能发布的两个大模型:MiniCPM 2B和OmniLMM。MiniCPM 2B被称为'小钢炮',在规模大小和性能上超越了Mistral-7B等大模型,展示了端侧大语言模型...
梭哈大模型的公司,给自己找了条退路
面壁智能最近发布了其旗舰端侧AI大模型MiniCPM-2B,这是一个拥有20亿参数的模型,它使用了1TB的精选数据进行训练。在多项主流评测榜单上,MiniCPM-2B的表现超...