“高性能”的搜索结果

谷歌掀桌子!开源Gemma:可商用,性能超过Llama 2!
2月22日,谷歌宣布开源了大语言模型Gemma,该模型与谷歌最新发布的Gemini使用相同架构,提供20亿和70亿两种参数版本。Gemma在多个主流测...
用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑
摘要:新加坡国立大学尤洋团队、加州大学伯克利分校和Meta AI Research共同发布了一项名为“Neural Network Diffusion”的研究,该研究利...
每秒500token的“网红”芯片Groq让人惊叹,但人们开始担心它的可用性
[功能切片/深度学习/并行性/分布式全局内存/Dragonfly网络][可用性/模型微调/内容长度/硬件成本/运营成本][硅基时代/技术发展/定制产品/...
比 GPT-4 快 18 倍、自研芯片比英伟达 GPU 快 10 倍的 Groq,能否撼动英伟达?
Groq AI芯片引发热议:Groq,这个硅谷公司最近因其自研芯片在大模型推理时的高速度引起了国内外人工智能领域的广泛关注。其产品能够在每...
九大最热门的开源AI Agent框架
本文介绍了九种备受关注的开源AI Agent框架,分别为AutoGPT、AutoGen、Langfuse、ChatDev、BabyAGI、CAMEL、SuperAGI、MetaGPT和ShortGP...
向微软“复仇”!支持OpenAI、Copilot 的Zed编辑器要干掉VS Code:Rust+少插件,速度贼快
Zed是一款支持多人协作的代码编辑器,采用Rust作为底层语言,自带rust-analyzer,主打高性能。项目于1月24日正式开源,采用Copyleft许可...
大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一
Medusa 的核心在于它的解码头和树注意力机制。解码头可以与原始模型一起训练,而树注意力机制则能够同时处理多个候选者。研究者提出了两...
7个值得关注的最佳大语言模型(LLM)
这篇文章介绍了几个当前(2024年1月)值得关注的大型开源LLM模型。首先介绍了Llama 2,这是Meta于2023年推出的一个在2万亿令牌上训练的...
免费提供GPT-4+GPTs,prompt全公开,这家大厂为什么这么财大气粗?
第一段提到了GPT-4的优点和缺点,指出了它的高性能和高价格,以及网络问题导致的使用成本过高。第二段介绍了字节的Coze,强调了它可以免...
1 32 33 34