标签:性能优化

Meta版o1来了!田渊栋团队整合快慢思考,能走迷宫推箱子

Meta FAIR的研究团队最近推出了一款名为Dualformer的新型人工智能模型,该模型能够将快速和慢速思考无缝结合,以提升性能并降低成本。Dualformer在推理轨迹和...

手机 AI 2.0 时代,OriginOS 5 找到了哪些「成功密码」?

智能手机系统正迈入AI浪潮的2.0时代,厂商们在推出AI功能手机的同时,面临如何将AI大模型能力融入手机的挑战。vivo在2024开发者大会上推出的OriginOS 5系统,...

开源软件Gradio上新5大功能,几行Python代码,构建Web应用程序

Gradio 5,一个由Hugging Face推出的开源Python软件包,已正式发布其稳定版本。这个工具旨在帮助用户快速构建机器学习模型、API或任何Python函数的演示或Web...

LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作

最新研究揭示了大型语言模型(LLM)之间合作的潜力,特别是在提升数学问题解决能力方面。蒙特利尔大学、剑桥大学、普林斯顿大学和谷歌DeepMind的研究人员发现...

中国最大开源MoE模型,255B参数无条件免费商用,元象发布

元象XVERSE发布了中国最大的MoE(Mixture of Experts)开源模型XVERSE-MoE-A36B,该模型拥有255B的总参数和36B的激活参数,实现了在不显著增加训练和推理计算...

Rust 引领前端基建新潮流:字节跳动的深度应用实践 | QCon

张磊,字节跳动Web Infra前端负责人,在即将到来的QCon上海站上,将分享XR技术和人工智能如何为大前端领域带来新机遇和挑战。张磊的演讲将围绕Rust语言在前端...

Atom原班人马做了一款新AI IDE,非常酷

Zed AI 是一款新兴的 AI 驱动代码编辑器,由原 Atom 编辑器团队开发,旨在解决性能问题,提供比 VS Code 更优的编码体验。它基于 Electron 框架构建,支持跨...

MiniMax 基于 Apache Doris 升级日志系统,PB 数据秒级查询响应技术实践

MiniMax公司,作为通用人工智能科技领域的领先企业,自主研发了多种模态的通用大模型,包括具有万亿参数的MoE文本大模型、语音大模型和图像大模型。公司致力...

英伟达玩转剪枝、蒸馏:把Llama 3.1 8B参数减半,性能同尺寸更强

Meta公司推出的Llama 3.1系列模型,包括一个405B的超大型模型和两个较小的模型,虽然性能卓越,但对计算资源的需求巨大。为解决这一问题,业界开始关注小型语...

Fireworks 乔琳:AI 产品上市时间从五年压缩到五天,我们的秘诀是什么?

Fireworks AI是一家提供生成式人工智能(GenAI)推理和调优服务的SaaS平台,其目标是为客户提供快速、经济、高度定制化的解决方案。公司在7月完成B轮融资,筹...
1 2 3 4