标签:大模型
SuperCLUE推理榜惊现黑马:原来中兴是一家AI公司?
中兴通讯凭借40年ICT技术积累正式进军AI赛道,并在中文大模型测评基准SuperCLUE的推理任务中以星云大模型NebulaCoder-V6的优异表现引发行业关注。该模型与字...
百度文心大模型4.5系列正式开源,同步开放API服务
百度近日宣布文心大模型4.5系列正式开源,并同步提供API服务。此次开源共推出10款模型,涵盖从47B参数的混合专家(MoE)模型到轻量级0.3B稠密型模型,覆盖文...
“港股AGI第一股”来了!云知声今早登陆港交所上市,最新市值146亿港元
云知声智能科技股份有限公司于6月30日正式在港交所主板挂牌上市,股票代码9678.HK,成为“港股AGI第一股”。公司定价为205港元/股,开盘后微涨0.1%,截至发稿时...
媲美DeepSeek!腾讯开源新版混元模型:AI Agent强化,超30种智能体指令
腾讯最新开源的混元大模型Hunyuan-A13B,是一个拥有800亿参数的专家混合模型,其中130亿参数处于激活状态。该模型支持快速和慢速两种思考模式,分别适用于简...
卷疯了!这个清华系Agent框架开源后迅速斩获1.9k stars,还要“消灭”Prompt?
随着大模型能力的突破,“可调用工具的智能体”已经从实验室概念迅速走向应用落地,成为继大模型之后的又一技术爆发点。围绕智能体(Agent)构建的开发框架和基...
2G 内存跑 Gemma 3n 完整版!全球首个 10B 内模型杀疯 LMArena:1300 分碾压记录
谷歌正式发布了Gemma 3n完整版,这是一款面向开发者的开源大模型,具备输入图像、音频和视频的能力,并支持文本输出。Gemma 3n的设计亮点在于其天生多模态和...
AI Infra 工程师们如何应对大模型流水线里的“暗涌”?
在大模型基础设施(Infra)领域,工程师们面临着诸多挑战和需求,尤其是在训练和推理环节的稳定性、性能优化以及资源调度方面。并行策略兼容性、工程流水线管...
5款大模型考「山东卷」,Gemini、豆包分别获文理第一名
近期,5款主流大模型参与了2025年山东高考全科闭卷测评,结果显示AI的应试能力已实现质的飞跃。字节跳动Seed团队组织的测评采用750分制,未进行任何提示工程...
重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练
过去几年,基于人类偏好的强化学习(RLHF)成为大语言模型(LLM)后训练阶段的关键技术,显著提升了模型的对齐能力,并拓展了其在推理增强、智能体交互等场景...
讲得了课、押得中题、学习规划还能量身定制,真卷到点子上的只有它
讯飞星火大模型X1在高考测试中表现卓越,语文作文、数学和英语分别获得国产AI中的高分排名。该模型作为科大讯飞推出的深度推理大模型,不仅支持多模态教学功...