标签:性能提升

Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

北大、UC伯克利和斯坦福的研究人员针对大型语言模型(LLM)在推理任务上的不足,提出了一种名为“思维缓冲区”(Buffer of Thoughts,简称BoT)的新方法。该方...

超越DPO,创新大模型优化算法SimPO

在人工智能领域,大模型如ChatGPT的优化至关重要特别是在根据人类反馈调整性能和减少非法内容输出方面。传统的直接偏好优化(DPO)方法依赖于参考模型,存在...

英特尔牙膏挤爆:功耗降40%、AI算力120TOPS,你的下一代笔记本没有内存条了

英特尔在追求AI技术发展方面迈出了重大步伐,推出了新一代的AI PC低功耗移动平台架构——Lunar Lake。该架构采用系统级芯片(SoC)设计,集成了16或32GB的LPDDR...

跟大厂拼价格到底!智谱AI 宣布模型全面降价,刘慈欣、AI 老罗线上“整活儿”

在人工智能领域,大型语言模型的创新正处于飞速发展期。智谱AI公司CEO张鹏在最近的Open Day上强调,大模型技术的进步不仅没有放缓,反而有加速的趋势。与此同...

昆仑万维开源 2 千亿稀疏大模型天工 MoE,全球首创能用 4090 推理

昆仑万维宣布开源其千亿稀疏大模型Skywork-MoE,此模型基于先前的Skywork-13B模型中间checkpoint扩展而成,是首个将MoE Upcycling技术应用并落地的开源千亿Mo...

Arm发布全新CPU: Cortex X925、A725 和A520

本文详细介绍了Arm公司2024年的重大技术进步,包括以下关键点:1. 客户端计算解决方案(CSS):这是Arm的新平台,旨在为各种终端设备提供强大的计算能力,包括...

搞医学影像,为什么都青睐于CPU?

在当前医学影像数据年增速高达30%,而影像科医生年增速仅为4%的背景下,AI医学影像市场的快速发展显得尤为重要。据预测,中国AI医学影像市场将在约4年时间内...

谷歌发布了第六代TPU芯片

谷歌云宣布推出其第六代张量处理单元(TPU)——Trillium TPU,在性能和能效方面实现了显著提升。这款新产品专为严苛的生成式人工智能模型设计,计算性能比现有...

原作者带队,LSTM真杀回来了!

长短时记忆(LSTM)网络自20世纪90年代引入以来,一直是深度学习领域的重要组成部分,尤其在处理序列数据方面表现出色。然而,随着可并行自注意力机制的Trans...

“我们坚持开源!”阿里云发布“地表最强”中文大模型:半年一迭代、性能翻倍?

阿里云大模型生态在通义大模型发布一周年之际迎来了一次重大升级,主要包括四个方面的突破:首先,通义千问 2.5 版本正式发布,其模型性能全面超越 GPT-4 Tur...
1 3 4 5 6 7 9