标签:大语言模型

追赶OpenAI的Sora:Meta开源V-JEPA,让AI学会认识世界!

Meta公司基于Yann LeCun提出的JEPA(联合嵌入预测架构)模型,开发了非生成视频模型V-JEPA。该模型旨在通过观察和自我思考、总结,使AI模型能够学习并模拟世...

不只是100万上下文,谷歌Gemini 1.5超强功能展示

AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,特别是谷歌发布的Gemini 1.5模型。尽管在发布当天遭遇...

普林斯顿DeepMind用数学证明:LLM不是随机鹦鹉!「规模越大能力越强」有理论根据

普林斯顿大学和DeepMind的科学家,Sanjeev Arora和Anirudh Goyal,通过数学方法证明了大语言模型(LLM)的能力随着规模的增大而增强,并非仅仅是随机组合训练...

谷歌产品大更新:Bard可生成图像;文生音乐平台等5大免费功能

在2月2日的谷歌官网更新中,谷歌对生成式AI产品进行了重大更新,包括类ChatGPT聊天助手Bard可以通过文本提示生成图像,全新的文生音乐平台MusicFX,新的文生...

重磅!第二代Qwen大模型开源,阿里巴巴一口气开源了30个模型,其中Qwen1.5-72B在MT-Bench评分仅次于GPT-4

以下是加粗后的文本:阿里巴巴开源了一系列名为Qwen的大语言模型,并在2023年8月首次公开了一个拥有70亿参数的版本。在接下来的几个月里,该公司陆续发布了四...

OpenChat-3.5:70亿参数下的AI突破

OpenChat-3.5是一款拥有70亿参数的先进大语言模型,具有卓越的编码能力和通用化方法,在多个基准测试中表现突出。该模型不仅超越了现有的语言学习模型(LLMs...

从入门到放弃的大语言模型(LLM)

文章总结:本文主要介绍了大语言模型(Large Language Model,LLM)及其在2023年及以后的应用前景。作者认为,2023年将成为大语言模型应用的元年,并将推动人...

大语言模型 vs 大模型

本文主要介绍了大模型的概念、分类以及与大语言模型的关系。大模型是基于神经网络的一种模型,由多个神经元组成,通过权重连接形成层次结构。神经网络通过学...

Baichuan3中文基准评测出炉!总分77.4分,位列国内第二|SuperCLUE

百川智能最近发布了其超千亿参数的大语言模型Baichuan3,该模型在多个英文评测上展现了接近GPT-4的性能,并通过迭代式强化学习技术进一步提升了语义理解和生...

揭秘Baichuan 3超越GPT-4的中文实力!文心一言、GLM 4.0也甘拜下风?全方位对比测试大揭秘!

1. 1月29日,百川智能推出了超千亿参数的大语言模型Baichuan 3,其在各项评测中表现出色,甚至在中文任务上超越了GPT-4,成为新的领头羊。2. Baichuan 3在中...
1 6 7 8 9