标签:大模型

钛媒体AGI独家|王小川下场做VC,百川智能已投资三家公司,并高薪聘请投资经理

搜狗创始人王小川创立的百川智能近期通过招聘投融资岗位释放出布局AGI生态投资的信号,其投资方向聚焦AI、具身智能及医疗技术领域。公开信息显示,百川智能已...

为什么中国只有一个 DeepSeek?

在DeepSeek风暴过后,中国的大模型创业圈出现了两个极端:一边是热血沸腾的算力厂商与模型服务厂商,以及开源受益者;另一边则是其他中国大模型创业公司和投...

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

近期,AIME 2025 I数学竞赛中大语言模型的表现引发了广泛关注。 一些顶尖模型如o3-mini和DeepSeek-R1分别取得了78%和65%的高分,而部分较小的蒸馏模型也意外...

刘知远详解 DeepSeek 出圈背后的逻辑:自身算法的创新以及 OpenAI 的傲慢

在探讨人工智能(AI)如何赋能全人类,实现大模型和通用人工智能的普及时,高效性成为了一个核心议题。智能革命被认为将经历与信息革命相似的阶段,即提高能...

「鲶鱼」DeepSeek 正在搅动上下游

DeepSeek的出现引发了AI领域的剧烈震荡,其低成本、高效能的大模型训练和推理方式推动了开源潮流,并给整个行业带来了深远影响。通过引入MoE架构和FP8混合精...

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

大模型时代的到来使算力成为技术发展的核心驱动力,同时也带来了大规模、高弹性、低成本的算力需求挑战。为了应对这一趋势,清微智能推出了基于可重构计算架...

DeepSeek无问西东!先行者早已趟平全国产之路

DeepSeek的迅速走红推动了国产AI产业的全面动员,其影响主要体现在平台层、算力层和应用层。在平台层,华为云、阿里云等云厂商快速接入相关服务,提供性能相...

百度点亮自研万卡集群,大模型应用拐点加速到来

DeepSeek是一款以较少GPU芯片和低成本实现高性能的国产大模型,其迅速获得包括百度在内的主流云厂商支持。2月3日,百度智能云千帆平台正式上线DeepSeek-R1和D...

16张H100训26分钟,超越o1-preview!李飞飞等用1K样本,揭秘测试时Scaling

提升大模型推理性能通常依赖于大量数据和算力,但李飞飞团队提出了一种新方法,仅使用1000个样本进行微调,并引入预算强制技术(budget forcing),在测试时...

DeepSeek点燃国产大模型斗志,RAG等核心技术被重估

东方的AI技术正在崛起,特别是中国的大模型技术在全球范围内引起了广泛关注。DeepSeek-R1作为一匹黑马,不仅在硅谷产生了震撼,还促使微软、亚马逊等云服务厂...
1 2 3 4 5 40