标签:性能评估

120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B

Stability AI最近推出了Stable LM 2 12B模型,这是其新模型系列的一个重要升级。该模型基于七种语言的2万亿Token进行训练,拥有120亿参数,性能在某些基准测...

弱智吧:大模型变聪明,有我一份贡献

机器之心报道了一项关于中文大型语言模型(LLM)的研究,该研究通过利用百度贴吧中的“弱智吧”内容作为数据集,对人工智能模型进行训练和评估。弱智吧以其高质...

Stability AI开源3B代码生成模型:可补全,还能Debug

本文报道了Stability AI 公司开源的小体量预训练模型 Stable Code Instruct 3B,该模型是一个基于 Stable Code 3B 的指令调整编码语言模型,能够处理各种任务...

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

何恺明的目标是探索面向复杂世界的智能。Sora是首个引起广泛关注的大规模通用视频生成模型,自OpenAI于2024年2月推出以来,没有其他视频生成模型能在性能或支...

英伟达要小心了!爆火的Groq芯片能翻盘吗?AI推理速度「吊打」英伟达?

本文主要探讨了人工智能公司Groq的AI芯片的实力与潜力,以及其对英伟达的挑战。Groq的AI芯片在处理大型模型token生成上表现出色,其生成速度远超其他使用GPU...

大模型增速远超摩尔定律!MIT最新研究:人类快要喂不饱AI了

近日,MIT的研究人员发表了一项关于大模型能力增速的研究,指出LLM的能力每8个月翻一倍,远超过摩尔定律。这意味着硬件可能无法跟上大模型的需求,引发了人们...

中科院等万字详解:最前沿图像扩散模型综述

中科院联合Adobe和苹果公司的研究人员发布了一篇关于图像编辑中扩散模型的重磅综述。这篇综述全文长达26页,包含1.5万余词,涵盖了297篇文献,全面研究了图像...

200万上下文窗口创飞Gemini 1.5!微软来砸谷歌场子了(doge)

谷歌发布了支持100万token的Gemini 1.5,刷新了大模型上下文窗口长度记录。随后,微软推出了名为LongRoPE的新方法,将上下文窗口拉长至2048k token,即200多...

统一多模态框架GPT4Video不仅能看懂视频也能生成视频(附视频demo)

腾讯人工智能实验室与悉尼大学在十一月发布了一项最新研究,提出了一种名为GPT4Video的统一多模态框架。该框架不仅能够理解多模态内容,如图片和视频,还能够...
1 2