大模型

LLM,VLM,模型

​前谷歌大佬离职创业,不到一年造出GPT3.5和Gemini Pro,惨痛忠告:GPU简直菜鸡,就像是买彩票!

前谷歌高级研究科学家Yi Tay离职后成立了大模型公司Reka,不到一年时间,便从零开始训练出了能与GPT3.5匹敌的大模型Reka,以及多模态大模型Gemini Pro。Yi Ta...

华为盘古大模型领航AI时代,这些概念股有望一飞冲天!

华为盘古大模型:采用深度学习技术,具备强大的智能化能力,在自然语言处理、图像识别和语音合成等领域表现出色,引领着新一轮科技革命。概念股全景扫描:涉...

我们与「邪恶GPT」的距离

本文探讨了大型语言模型(LLMs)在推动创新变革的同时,也带来了网络安全和伦理道德方面的挑战。文章首先提出了大型模型可能成为虚假信息传播、网络钓鱼、社...

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

摘要:本文介绍了一种名为OmniQuant的新型大语言模型(LLM)量化算法。该算法由上海人工智能实验室、香港大学和香港中文大学的研究者共同提出,旨在解决大语...

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

机器之心专栏机器之心编辑部近期报道了Meta开源的LLaMA架构在大型语言模型(LLM)中的成功应用,以及最新研究成果VisionLLaMA的进展。VisionLLaMA是一种旨在实...

Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时

在最近的报道中,AI 图像生成公司 Midjourney 和 Stability AI 之间发生了一起引人注目的事件。据爆料者透露,Midjourney 的服务器在上周六凌晨遭受了来自 St...

Sora 时代的 AI 视频生成何去何从?

在全球范围内,OpenAI最新发布的视频生成模型Sora引起了热烈讨论。距离上一个备受关注的Pika 1.0发布不到三个月的时间。Sora生成的视频具有合理的连贯性和逼...

「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

摘要:在机器之心编辑部的专栏中,介绍了牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作,解决了计算机视觉中遮挡问题的挑战。该工作提出了非模态分割(...

田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

摘要:本文报道了Meta FAIR的田渊栋及其团队最新研究成果,提出了一种名为GaLore的内存高效的LLM训练方法。该方法通过Gradient Low-Rank Projection实现了在...

挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4

摘要:本文报道了美国 AI 创业公司 Inflection AI 发布的新一代大语言模型 Inflection-2.5,该模型结合了强大的LLM能力和Inflection标志性的「同理心微调」,...
1 371 372 373 374 375 441