大模型

LLM,VLM,模型

技术更新 or 组织重塑,企业如何用好“数据智能”?

大模型技术的快速发展正在深刻改变数据管理与分析的方式,Chat BI、Agent+Workflow等应用使得业务人员能够通过自然语言交互即时获取数据洞察,显著提升了生产...

请记住 MiniMax M1:MiniMax 用自己的方法追上R1们,直奔最强Agent模型而去

MiniMax M1 的发布标志着该公司在基础模型领域的一次重大突破。该模型采用了线性注意力 Lightning Attention 机制,并将其与传统的 softmax attention 相结合...

谷歌助力神经科学飞跃,破解斑马鱼全脑活动密码

谷歌、哈佛大学、HHMI Janelia研究所和拉德堡德大学的科学家们联合发布了一项开创性的研究成果——ZAPBench,这是一个专门用于预测斑马鱼全脑活动的基准测试平...

华为CloudMatrix384超节点:官方撰文深度解读

在2025年华为云生态大会上,华为推出了CloudMatrix 384超节点,旨在应对AI时代的海量算力需求。这一新型架构基于“一切可池化、一切皆对等、一切可组合”的高速...

Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿

月之暗面近期发布了开源代码模型Kimi-Dev-72B,该模型在软件工程任务基准测试SWE-bench Verified上取得了60.4%的成绩,创下开源模型新纪录,超越了包括DeepSe...

微软分享三大王炸算法:突破大模型推理瓶颈,性能大涨

微软近日分享了其自研的三大创新算法——rStar-Math、LIPS和CPL,旨在增强大语言模型的推理能力,特别是在数学推理和思考链方面的表现。这些算法不仅适用于小参...

首个转型AI公司的新势力,在全球AI顶会展示下一代自动驾驶模型

小鹏汽车近期在智能驾驶领域取得显著进展,其全球首款L3级算力AI汽车G7正式亮相,搭载三颗自研图灵AI芯片,有效算力超过2200TOPS,并首次部署了VLA+VLM视觉大...

Transformer八子初创:AI横扫NP难题竞赛,Top 2%选手竟是智能体!

Sakana AI与AtCoder合作构建了ALE-Bench,这是一个专注于NP难题的编程基准测试,旨在评估AI在复杂优化任务中的表现。NP难题,如物流路径选择、人员排班等,因...

MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

MiniMax近期在X平台上预告了一整周的发布计划,首日推出了开源推理模型MiniMax M1,这一模型在多个评测集上表现优异,尤其在上下文处理能力上取得了显著突破...

苹果AI新进展:Qwen3已全面“登陆”苹果MLX框架

阿里巴巴Qwen团队于2024年6月16日宣布推出支持苹果MLX架构的Qwen3模型,这一举措标志着中国开源大模型在苹果设备上的本地化运行迈出了重要一步。Qwen3模型提...
1 35 36 37 38 39 370