标签:语言模型
微软秘密开发首个千亿大模型,竟由OpenAI对手操刀!网友:你不要奥特曼了?
微软正在开发一个名为MAI-1的新型人工智能模型,这标志着该公司在人工智能领域的重大发展。MAI-1将是一个具有约5000亿参数的大型语言模型,位于OpenAI的GPT-3...
苹果AI终于来了!从2.7到30亿四款大模型代码全开源,AI技术持续“狂飙”|钛媒体AGI
苹果公司在Hugging Face平台上发布了名为OpenELM的开源高效语言模型,该模型有四种不同尺寸的版本,参数数量从2.7亿到30亿不等。这些模型定位于超小规模,运...
微软开源最强小参数大模型—Phi-3 Mini
本文介绍了微软在AIGC领域的最新动态,着重关注了微软发布的小参数大语言模型Phi-3-mini。Phi-3-mini是微软Phi家族的第4代模型,拥有38亿参数,但训练数据高...
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
这篇文章报道了斯坦福大学团队最新的研究成果,该研究声称语言模型实际上是一个 Q 函数而不是奖励函数。他们提出了一种直接对齐方法,即在上下文多臂赌博机设...
ChatGPT能预测未来特定事件,准确率高达97%
```这篇文章主要介绍了贝勒大学经济学院的两位教授基于OpenAI的GPT-3.5和GPT-4对大型语言模型在预测能力方面的研究成果。研究人员使用了直接预测和未来叙述两...
Transformer本可以深谋远虑,但就是不做
这篇报道探讨了语言模型是否会规划未来token的问题。研究发现,虽然Transformer有能力预测未来token,但在实践中并不会这样做。人类在使用语言时会预测即将出...
开源模型越来越落后?Llama 3 说李总你真幽默
Llama 3 正式发布,被 Meta 宣称为迄今为止最强大的开源大模型。这一版本推出了两种规模的预训练语言模型,分别拥有 80 亿和 700 亿参数,以支持更广泛的应用...
Meta无限长文本大模型来了:参数仅7B,已开源
Meta近日提出了一种名为MEGALODON的新型神经架构,用于高效地处理无限长的文本序列。这一技术的提出是为了解决传统Transformer模型在处理长序列时存在的二次...
DeepMind前员工创立的AI公司发布新模型,能理解音频与视频,推理性能超过Gemini
Reka是一家总部位于旧金山的AI初创公司,由来自DeepMind、Google和Meta的研究人员联合创立,最近推出了一款名为Reka Core的全新多模态语言模型。这款模型被誉...
Claude 3说服力堪比人类!Anthropic最新研究揭秘LLM惊人能力
Anthropic最近发布的研究成果表明,他们开发的人工智能模型Claude 3 Opus在说服力方面与人类相当。这一发现对于评估语言模型的说服力具有重要意义,因为说服...