“模型优化”的搜索结果

Mamba-2架构在AI界再次引发关注，其在统一状态空间模型（SSM）和注意力机制（Attention）的基础上，成功将Transformer模型与SSM结合，形...

AIGC动态

5个月前

在自然语言处理领域，大语言模型如GPT-4、Gemini系列和Llama-3等，通常采用下一个token预测的损失函数进行预训练。然而，这种预训练方法...

AIGC动态

5个月前

谷歌发布了第六代TPU芯片

谷歌云宣布推出其第六代张量处理单元（TPU）——Trillium TPU，在性能和能效方面实现了显著提升。这款新产品专为严苛的生成式人工智能模型...

AIGC动态

5个月前

产品人的AI观点：1. 用户在使用AI图像/视频生成产品时，更关注可控性和成本。专业用户倾向于使用SD WebUI/ComfyUI工作流，而普通用户则...

AIGC动态

5个月前

智谱AI，作为大模型领域的融资王者，最近对外进行了一项新的投资，将资金注入了清华系公司清程极智。清程极智的主营业务是构建高效的人...

AIGC动态

7个月前

2023年，硅谷再次成为科技创新的焦点，特别是在生成式AI领域。这一年，标普500指数的70%增长由七大科技巨头推动，这些公司大多位于硅谷...

AIGC动态

7个月前

在大会上，发表了《加速向 AI 定义的汽车的转变》主题演讲，详细介绍了英伟达在自动驾驶领域的最新进展和技术创新。吴新宙在演讲中分享...

AIGC动态

7个月前

英伟达在其GTC大会上宣布了新一代Blackwell架构，旨在为人工智能带来30倍的推理加速，被形容为“新工业革命的引擎”。这一架构的细节在英...

AIGC动态

7个月前

本文介绍了专注于AIGC领域的专业社区，关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地的情况。ChatGPT...

AIGC动态

7个月前

ChatGPT参数规模被扒：只有7B

这篇文章报道了南加州大学团队对ChatGPT进行攻击并揭露其参数规模的研究成果。他们使用一种攻击方法，仅花费不到1000美元就成功挖出了最...

AIGC动态

7个月前