标签:成本效益

把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek“国产之光”实至名归?

中国AI初创公司DeepSeek发布了其最新人工智能模型DeepSeek-V3的首个版本,并宣布开源。该模型能够处理多种基于文本的工作负载和任务,包括编码、翻译和撰写论...

国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

DeepSeek V3,一个参数量为671B的MoE模型,已全面开源。该模型在14.8T高质量token上进行了预训练,激活37B参数,并在多项测评中达到开源SOTA,超越了Llama 3....

英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了

英伟达近期推出了AI芯片领域的新核弹——GPU新核弹B300和附带CPU的超级芯片GB300。这两款产品在算力和显存方面相比前代B200有显著提升,FLOPS提高50%,显存从19...

OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题

OpenAI最近推出了其下一代推理模型o3,这是一个在多个领域刷新了现有最佳性能(SOTA)的模型。o3在数学、编程和软件工程等领域的表现超越了前代o1,特别是在A...

OpenAI狂打“骨折价”的一天:暴降成本开放全新o1,实时 API 全面降价 60%

近期,OpenAI和谷歌在人工智能领域展开了激烈的竞争。OpenAI推出了一系列针对开发者的新功能和升级,包括API中的OpenAI o1模型,该模型支持函数调用、开发人...

Sora终于来了,但多模态AI呼唤实用主义

OpenAI发布的视频生成模型Sora Turbo在实测中未能超越市场上现有视频模型,存在视频时长、生成效果一致性、指令遵循等方面的不足。Sora项目被比作视频版GPT-1...

仅4个多月RAG就进化到“一个新时代”了:成本降低到GraphRAG的0.1%

微软最近推出了LazyGraphRAG,这是一种新型的RAG(检索增强生成)系统,旨在以高效且低成本的方式实现图形RAG功能。LazyGraphRAG结合了VectorRAG和GraphRAG的...

干掉HBM?

随着人工智能(AI)大模型训练需求的增长,对算力和高带宽存储器(HBM)的需求也在增加。GPU提供算力,而HBM提供带宽,成为AI发展的关键。然而,HBM价格昂贵...

苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果

苹果公司近日在开源大模型领域取得了重大进展,推出了一款7B参数的模型,其性能与Llama 3 8B相当,且一次性开源了全部训练过程和资源。这一举措受到了业界的...

OpenAI推出GPT-4o mini,更小更强更便宜

OpenAI近期推出了GPT-4o的小型版本——GPT-4o mini,这是市场上最具成本效益的小型模型。GPT-4o是首个能够本地处理多模态输入和输出的AI模型,但发布后不久就被...
1 2