“评测标准”的搜索结果

千亿模型 Yi-Large 杠上万亿 GPT-4 Turbo,多项能力不输 OpenAI
在近期的大模型竞技场Chatbot Arena中,一款名为“im-also-a-good-gpt2-chatbot”的模型引起了广泛关注,它超越了包括GPT-4-Turbo、Gemini...
全球140+模型考试出炉!超8万道考题国产模型分数亮眼,智源评测体系发布
智源研究院于2024年5月17日推出了一套科学、权威、公正、开放的大模型评测体系,并对全球140余个大模型进行了全方位能力评测。评测从主...
全球140+大模型全方位评测结果出炉,智源评测体系发布
智源研究院在2024年5月17日举办了大模型评测发布会,推出了科学、权威、公正、开放的智源评测体系。该评测对国内外140余个大模型进行了...
国内外140+大模型、8万+考题测评结果出炉!智源评测体系出品
智源研究院于2024年5月17日推出了一项科学、权威、公正、开放的大模型评测体系,并发布了国内外140余个语言及多模态大模型的全方位能力...
别再说国产大模型技术突破要靠 Llama 3 开源了
近日,Meta发布了开源大模型Llama 3的8B和70B版本,引起了AI界的广泛关注。Meta声称Llama 3在多种行业基准测试上展现了最先进的性能,并...
阿里刚开源32B大模型,我们立马测试了“弱智吧”
阿里巴巴开源新模型阿里巴巴近期开源了其最新的人工智能模型“通义千问”(Qwen)1.5-32B版本,这是1.5系列的最后一块拼图。该模型在多项...
月之暗面Kimi模型升级:200万字窗口版可申请,新增“继续”功能
文章介绍了杨植麟的大模型公司月之暗面进行了一次公开活动,发布了更长上下文窗口的版本,即200万字上下文版本,并在Kimi上开启内测。虽...
透过科大讯飞的“AI+”行业实地战,看中国新质生产力变革的未来之路
人工智能+(AI+)在2024年两会中首次被写入政府工作报告,标志着国家将加强顶层设计,加速形成以AI为引擎的新质生产力。全国人大代表、...
Meta与OpenAI文生图工具评测-下
这篇文章主要是对两款文生图AI工具Imagine with Meta和DALL-E3生成的图片进行了详细的评测。评测过程中,使用了GPT4来完成评测,通过专...
一年过去了,国产大模型怎样了?——用户视角的 12 家 AI 产品评测
原文作者:刘言飞语 作者简介:做一个产品观察者。 微信号:liufeinotes 关键词:AI、大模型、评测、ChatGPT、国产 文章摘要: 背景与...