大模型
LLM,VLM,模型
Transformer八子初创:AI横扫NP难题竞赛,Top 2%选手竟是智能体!
Sakana AI与AtCoder合作构建了ALE-Bench,这是一个专注于NP难题的编程基准测试,旨在评估AI在复杂优化任务中的表现。NP难题,如物流路径选择、人员排班等,因...
MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。
MiniMax近期在X平台上预告了一整周的发布计划,首日推出了开源推理模型MiniMax M1,这一模型在多个评测集上表现优异,尤其在上下文处理能力上取得了显著突破...
苹果AI新进展:Qwen3已全面“登陆”苹果MLX框架
阿里巴巴Qwen团队于2024年6月16日宣布推出支持苹果MLX架构的Qwen3模型,这一举措标志着中国开源大模型在苹果设备上的本地化运行迈出了重要一步。Qwen3模型提...
让大模型做高考题,结论没那么简单
随着高考结束,许多学生开始使用大模型来解答高考试题,结果显示大模型在这类任务上已经表现得非常熟练。这一现象引发了对未来高考防作弊难度的担忧,尤其是...
酒店如何用AI吃下演唱会“流量红利”?
美团近期在AI领域的布局迅速推进,推出了多个面向不同行业的AI工具,尤其是在酒店业的应用引起了广泛关注。6月5日,美团发布了名为“美团既白”的垂类AI产品,...
松下发布多模态大模型,文本、图像、音频随意切换
随着大模型技术的快速发展,多模态数据处理逐渐成为研究热点。多模态生成任务通过整合文本、图像、音频等多种类型的数据,实现不同模态之间的相互转换与生成...
我感受到了程序员的新红利。
火山引擎Force大会展示了豆包大模型1.6的突破性进展,其深度思考能力通过多轮搜索推理机制达到全球一流水准。模型采用迭代式问题探索模式,与OpenAI最新技术...
AI进化三年,产业落地真拐点可能就在这场全球顶尖金融智能赛事里
AI 技术正在从模型性能的竞争转向实际应用价值的探索。随着生成式 AI 的快速发展,模型参数量和训练成本不断攀升,但性能提升并非终点,真正的挑战在于如何将...
Scaling Law首次在自动驾驶赛道被验证!小鹏汽车CVPR演讲详解:AI「吃」下6亿秒视频后,智能涌现
小鹏汽车在CVPR 2025自动驾驶分论坛上展示了重大技术突破,首次验证了Scaling Law在自动驾驶VLA模型上的有效性。作为唯一受邀发表主题演讲的车企,小鹏通过新...
13年死磕一个真理,这家中国AI黑马冲刺IPO
深圳地铁20号线上,一位老人用方言对着售票机说出目的地后,机器仅用1.5秒就准确出票,而传统方式需要15秒。这一场景背后是云知声数万小时方言训练的成果,展...