大模型

前谷歌大佬离职创业，不到一年造出GPT3.5和Gemini Pro，惨痛忠告：GPU简直菜鸡，就像是买彩票！

前谷歌高级研究科学家Yi Tay离职后成立了大模型公司Reka，不到一年时间，便从零开始训练出了能与GPT3.5匹敌的大模型Reka，以及多模态大模型Gemini Pro。Yi Ta...

AIGC动态

10个月前

华为盘古大模型：采用深度学习技术，具备强大的智能化能力，在自然语言处理、图像识别和语音合成等领域表现出色，引领着新一轮科技革命。概念股全景扫描：涉...

AIGC动态

10个月前

本文探讨了大型语言模型（LLMs）在推动创新变革的同时，也带来了网络安全和伦理道德方面的挑战。文章首先提出了大型模型可能成为虚假信息传播、网络钓鱼、社...

AIGC动态

10个月前

摘要：本文介绍了一种名为OmniQuant的新型大语言模型（LLM）量化算法。该算法由上海人工智能实验室、香港大学和香港中文大学的研究者共同提出，旨在解决大语...

AIGC动态

10个月前

机器之心专栏机器之心编辑部近期报道了Meta开源的LLaMA架构在大型语言模型(LLM)中的成功应用，以及最新研究成果VisionLLaMA的进展。VisionLLaMA是一种旨在实...

AIGC动态

10个月前

在最近的报道中，AI 图像生成公司 Midjourney 和 Stability AI 之间发生了一起引人注目的事件。据爆料者透露，Midjourney 的服务器在上周六凌晨遭受了来自 St...

AIGC动态

10个月前

在全球范围内，OpenAI最新发布的视频生成模型Sora引起了热烈讨论。距离上一个备受关注的Pika 1.0发布不到三个月的时间。Sora生成的视频具有合理的连贯性和逼...

AIGC动态

10个月前

摘要：在机器之心编辑部的专栏中，介绍了牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作，解决了计算机视觉中遮挡问题的挑战。该工作提出了非模态分割（...

AIGC动态

10个月前

摘要：本文报道了Meta FAIR的田渊栋及其团队最新研究成果，提出了一种名为GaLore的内存高效的LLM训练方法。该方法通过Gradient Low-Rank Projection实现了在...

AIGC动态

10个月前

摘要：本文报道了美国 AI 创业公司 Inflection AI 发布的新一代大语言模型 Inflection-2.5，该模型结合了强大的LLM能力和Inflection标志性的「同理心微调」，...

AIGC动态

10个月前