大模型
LLM,VLM,模型
首席分析师揭秘爆火Groq,每小时要烧168美元!10倍H100拥有成本,老黄笑而不语
摘要:Groq是一家AI初创公司,推出了一种大模型推理解决方案,声称其速度比现有GPU快4倍,成本低70%。然而,SemiAnalysis的分析显示,Groq的持有成本是英伟达...
GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智
摘要:谷歌DeepMind和斯坦福的研究人员发现,大模型在处理逻辑推理任务时,信息呈现的顺序对模型表现有显著影响。研究表明,当信息按逻辑顺序排列时,模型表...
软银押注、身背8亿对赌,交大校友AI大模型热潮下再战IPO
文章总结了AI公司声通科技在AI大模型热潮下的上市过程。声通科技主要为企业客户提供基于AI技术的云呼叫中心和智能客服,服务于智慧城市、智慧交通、智慧金融...
深度 | 万模大战,杀出一匹黑马
文章总结:本文主要介绍了近期在多模态大模型领域的最新进展,包括LLaVA-NeXT、SPHINX-X、MobileVLM和CogCoM等多个模型。这些模型在性能、训练成本、多模态理...
谷歌推出最先进的新开放模型Gemma!在个人电脑上也可以运行大语言模型啦!
Google 发布了名为 Gemma 的首个基于 Gemini 的开放式 LLM,具有 2B 和 7B 两种参数规格,可用于商业用途。Gemma 模型在 LLM 排行榜上表现出色,尤其 7B 版本...
Sora爆火!人工智能将如何改变世界?
摘要:近期,人工智能技术的发展引起了广泛关注。美国OpenAI发布了首个视频生成模型“Sora”,能够根据文本指令生成60秒短视频。此外,谷歌公司的“巴德”(现更...
使用 Hugging Face 微调 Gemma 模型
在这篇文章中,我们将介绍 Google Deepmind 开放的 Gemma 语言模型,它现在可以通过 Hugging Face 向更广泛的开源社区开放。Gemma 提供了两个规模的版本:2B ...
不解决这个问题,OpenAI Sora没戏
OpenAI的Sora是一款文本到视频的AI模型,能够根据文本描述生成逼真的视频,引起了广泛关注。Sora的视频生成时长可达60秒,远超其他AI视频应用。尽管Sora在视...
打入AI底层!NUS尤洋团队用扩散模型构建神经网络参数,LeCun点赞
新加坡国立大学尤洋教授团队联合UCB、Meta AI实验室等机构开源了一项研究成果,提出了一种用于生成神经网络参数的扩散模型p(arameter)-diff。该模型能够显著...
陶哲轩:AI让业余数学家也能做出贡献
在Quantamagazine的访谈中,著名数学家陶哲轩分享了他对数学、AI以及技术工具的看法。他认为AI将对数学产生深远影响,特别是在证明生成和数学研究的协作方面...