标签:大模型
基于闪电注意力机制,创新高效开源大模型
MiniMax公司开源了基于闪电注意力机制的专家混合模型MiniMax-M1,该模型在架构、创新模块和训练框架上均实现了显著突破。MiniMax-M1总参数为4560亿,其中459...
Kimi K2发布两天即“封神”?80%成本优势追平Claude 4、打趴“全球最强AI”,架构与DeepSeek相似!
月之暗面最新发布的MoE架构基础模型Kimi K2在海外引发了广泛关注。该模型的总参数量达到1万亿,激活参数为32B,已在Kimi Web端和App端上线。Kimi K2在OpenRou...
碾压DeepSeek V3!开源AI Agent专属模型,1万亿参数、工具使用能力超强
月之暗面(MoonshotAI)近期开源了其最新的大模型Kimi-K2,这是一个混合专家模型,总参数达到1万亿,其中320亿参数处于激活状态,训练数据规模高达15.5Ttoken...
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
Kimi在172天后发布了全新的Kimi K2基础大模型,采用MoE架构,总参数达到1T,激活参数为32B,尤其在代码、Agent和数学推理任务上展现了领先能力。此次发布不仅...
深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?
月之暗面正式发布了 Kimi K2 大模型并开源,新模型同步上线并更新了 API,价格为 16 元人民币 / 百万 token 输出。此次发布赶在了全球大模型集中发布的风口浪...
全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四
AI大模型在科研领域的应用日益广泛,但如何准确评估其科研能力仍是一个难题。为了解决这一问题,Ai2联合耶鲁大学和纽约大学推出了SciArena,这是一个专为科学...
阿里达摩院开源多模态医学大模型—灵枢
大模型在医疗领域的应用面临三大主要难题:医疗知识覆盖不足、幻觉风险高以及推理能力欠缺。为了解决这些问题,阿里巴巴达摩院的研究团队开源了统一多模态医...
AI 语音爆发的这半年,一位「局中人」看到的赛道爆发逻辑
过去半年,AI语音领域迎来了密集的融资热潮,多家初创公司获得了大额投资,推动了这一赛道的快速发展。例如,Wispr Flow、Cartesia和ElevenLabs等公司分别完...
冲击IPO上市关口,智谱获上海国资10亿元战略融资
在7月2日举行的智谱开放平台产业生态大会上,智谱宣布获得浦东创投集团和张江集团总额10亿元的战略投资,并已完成首笔交割。此次融资标志着智谱在IPO上市辅导...
百度搜索近10年最大改版,自己革自己的命?
百度搜索近期进行了近10年来最大规模的改版,标志着其从底层技术到用户体验的全链路升级。最显著的变化是AI智能框的引入,取代了传统的搜索框,支持超长文本...