“模型评测”的搜索结果

千亿模型 Yi-Large 杠上万亿 GPT-4 Turbo,多项能力不输 OpenAI
在近期的大模型竞技场Chatbot Arena中,一款名为“im-also-a-good-gpt2-chatbot”的模型引起了广泛关注,它超越了包括GPT-4-Turbo、Gemini...
全球140+模型考试出炉!超8万道考题国产模型分数亮眼,智源评测体系发布
智源研究院于2024年5月17日推出了一套科学、权威、公正、开放的大模型评测体系,并对全球140余个大模型进行了全方位能力评测。评测从主...
全球140+大模型全方位评测结果出炉,智源评测体系发布
智源研究院在2024年5月17日举办了大模型评测发布会,推出了科学、权威、公正、开放的智源评测体系。该评测对国内外140余个大模型进行了...
国内外140+大模型、8万+考题测评结果出炉!智源评测体系出品
智源研究院于2024年5月17日推出了一项科学、权威、公正、开放的大模型评测体系,并发布了国内外140余个语言及多模态大模型的全方位能力...
清华SuperBench全球测评出炉,Claude 3拿下多个冠军!合成数据才是人类未来?
清华大学SuperBench团队最近发布了新一轮的全球大模型评测结果。在语义理解、智能体能力和代码能力三个测评中,Claude 3模型表现出色,...
轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便
这篇文章介绍了上海AI Lab和香港中文大学等研究机构提出的InternLM-XComposer2-4KHD(IXC2-4KHD)模型,这是一个可以自动分析PDF、网页...
国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队
在2023年的'百模大战'中,众多实践者推出了各类模型,包括原创和针对开源模型微调的模型,以及通用和行业特定的模型。为了合理评价这些...
埋头钻研一年后,阶跃星辰交出了第一份答卷
在去年的百模大战之后,大模型的落地应用逐渐成为了主流。阶跃星辰,这家初创公司虽然在去年底才浮出水面,但其背后的实力不容小觑。公...
最神秘国产大模型团队冒泡,一出手就是万亿参数MoE,两款应用敞开玩
阶跃星辰,由微软前全球副总裁姜大昕创办的国内基础大模型创业公司,终于正式亮相。姜大昕在微软的职位极高,但他选择离开微软创业,这...
国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI
新智元报道了一家名为“阶跃星辰”的初创公司在2024全球开发者先锋大会上发布了三个大型模型:Step-1千亿参数语言大模型、Step-1V千亿参数...
1 2 3