大模型
LLM,VLM,模型
AMD开源30亿小参数模型,媲美Qwen-2.5
AMD在官网开源了最新的小参数模型Instella-3B,该模型基于AMD Instinct™ MI300X GPU从头训练,展现了AMD GPU在训练高性能大模型方面的潜力。Instella-3B的性...
性能暴增150%的地表最强AI芯片发布,英伟达捍卫算力“霸主”,英特尔前CEO也来助威|钛媒体AGI
在2024年GTC大会上,英伟达创始人兼CEO黄仁勋发布了多款重磅AI产品,包括最强AI芯片GB300、个人AI超级计算机DGX Spark,以及预告了新一代芯片Vera Rubin。GB3...
直击黄仁勋GTC演讲:揭秘下一代芯片Rubin,要把“DeepSeek红利”通通吃掉,货已卖到2027年
黄仁勋在2025年GTC大会上的主题演讲中,展示了英伟达在AI领域的最新突破和未来规划。此次演讲的核心围绕AI推理时代的到来,强调了算力需求的急剧增长以及英伟...
专为DeepSeek类强推理加速,老黄拿出Blackwell Ultra,下代架构性能还要翻倍
英伟达在GTC大会上展示了其在人工智能领域的最新进展,重点介绍了Blackwell架构的AI加速卡及其在推理任务中的强大性能。Blackwell架构已经全面投产,并将在20...
老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录
在英伟达的GTC大会上,首席执行官黄仁勋展示了多项突破性技术和产品,涵盖了AI芯片、个人AI超级计算机、开源软件以及自动驾驶等领域。最引人注目的是新一代AI...
240元打造擅长数学的多模态版R1,基于DeepSeek核心思想,两阶段训练提升推理能力至工业级应用标准
多模态大模型在视觉理解方面表现出色,但在深度数学推理任务上往往表现不佳,尤其是参数量较小的模型。为了解决这一问题,东南大学、香港中文大学、蚂蚁集团...
Django创造者Simon Willison分享:我如何使用LLM帮我写代码
大型语言模型(LLM)在编程中的应用近年来引起了广泛关注,尤其是Andrej Karpathy提出的“氛围编程”概念,强调开发者通过与LLM的互动来简化代码生成过程。然而...
英伟达软硬件“双拳出击”:Blackwell Ultra、Rubin 芯片炸场,开源Dynamo让R1 token生成暴涨40倍
英伟达 GTC 2025 大会在加利福尼亚州圣何塞会议中心盛大开幕,吸引了全球科技界的广泛关注。作为人工智能和计算机图形学领域的顶级峰会,GTC 大会被视为行业...
OpenAI对AI编程的预判相当激进。
OpenAI 首席产品官 Kevin Weil 在专访中透露,OpenAI 正在整合 GPT 和 o 系列模型,并计划推出 GPT-5。他预测,到今年底,99% 的编码将实现 AI 自动化,这一...
Lovable:欧洲增速最快AI企业,15人团队3个月ARR破1700万美元
Lovable 是一家来自瑞典的 AI 编程公司,其前身是开源项目 GPT Engineer,在 GitHub 上拥有超过 5 万星标。2024 年 11 月正式发布产品后,Lovable 的 ARR(年...