“模型优化”的搜索结果

Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍
Mamba-2架构在AI界再次引发关注,其在统一状态空间模型(SSM)和注意力机制(Attention)的基础上,成功将Transformer模型与SSM结合,形...
Meta等最新研究:多token预测,提升大模型推理效率
在自然语言处理领域,大语言模型如GPT-4、Gemini系列和Llama-3等,通常采用下一个token预测的损失函数进行预训练。然而,这种预训练方法...
谷歌发布了第六代TPU芯片
谷歌云宣布推出其第六代张量处理单元(TPU)——Trillium TPU,在性能和能效方面实现了显著提升。这款新产品专为严苛的生成式人工智能模型...
一线创业者圆桌讨论:多模态 AI 的创业机会在于「有用」
产品人的AI观点:1. 用户在使用AI图像/视频生成产品时,更关注可控性和成本。专业用户倾向于使用SD WebUI/ComfyUI工作流,而普通用户则...
智谱再投AI Infra清华系公司!已在大模型生态投资超13家企业
智谱AI,作为大模型领域的融资王者,最近对外进行了一项新的投资,将资金注入了清华系公司清程极智。清程极智的主营业务是构建高效的人...
关于生成式AI,硅谷VC张璐的9个观点
2023年,硅谷再次成为科技创新的焦点,特别是在生成式AI领域。这一年,标普500指数的70%增长由七大科技巨头推动,这些公司大多位于硅谷...
吴新宙到英伟达后的首秀,说了些什么?
在大会上,发表了《加速向 AI 定义的汽车的转变》主题演讲,详细介绍了英伟达在自动驾驶领域的最新进展和技术创新。吴新宙在演讲中分享...
英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密
英伟达在其GTC大会上宣布了新一代Blackwell架构,旨在为人工智能带来30倍的推理加速,被形容为“新工业革命的引擎”。这一架构的细节在英...
英伟达推出NIM,可优化推理以实现大规模AI模型部署
本文介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。ChatGPT...
ChatGPT参数规模被扒:只有7B
这篇文章报道了南加州大学团队对ChatGPT进行攻击并揭露其参数规模的研究成果。他们使用一种攻击方法,仅花费不到1000美元就成功挖出了最...
1 2 3 4 5