标签:性能提升

零一万物自研全导航图向量数据库,权威榜单评测 6 项第一

零一万物成功研发新型向量数据库“笛卡尔(Descartes)”,并在ANN-Benchmarks 6项数据集评测中获得第一名。向量数据库作为AI 2.0时代的关键技术,可帮助大模型...

当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」

摘要总结:本文探讨了大语言模型(LLMs)在处理复杂任务时的局限性,并提出了一种新的基于分治算法的提示策略(Divide-and-Conquer, DaC),以提高模型在面对...

挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4

摘要:本文报道了美国 AI 创业公司 Inflection AI 发布的新一代大语言模型 Inflection-2.5,该模型结合了强大的LLM能力和Inflection标志性的「同理心微调」,...

M3芯片版MacBook Air发布!苹果:最好的消费级AI笔记本

苹果公司近日发布了搭载M3芯片的新款MacBook Air,起售价为8999元。新款MacBook Air将于3月6日上午9点开始接受订购,并于3月8日正式发售。根据苹果官方数据,...

Anthropic 发布 Claude 3 系列模型,世界最强模型易主!GPT-4被全面超越

在这篇文章中,介绍了Anthropic公司最新发布的Claude 3家族,包括小杯Haiku、中杯Sonnet和大杯Opus。这些模型在性能参数和响应时间上都有显著提升,Opus在多...

Anthropic发布Claude 3模型,性能超过GPT-4

Anthropic,一家由OpenAI前高管创立的AI初创公司,最近宣布推出了Claude 3模型系列,这一系列包括三个模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus...

数量即力量!腾讯揭秘:Agent数量越多,大语言模型效果越好

本文介绍了腾讯研究者们在大语言模型(LLM)的可拓展性(scaling property)方面的新发现。研究者们通过简单的采样投票方法,证明了LLM的性能会随着实例化age...

老黄祭出全新RTX 500 GPU,AIGC性能狂飙14倍!AI应用的门槛彻底被打下来了

在2024年的世界移动大会上,英伟达发布了其移动工作站GPU产品线的最后两款产品:RTX 500 Ada和RTX 1000 Ada。这两款入门级移动工作站GPU的发布,标志着英伟达...

用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑

摘要:新加坡国立大学尤洋团队、加州大学伯克利分校和Meta AI Research共同发布了一项名为“Neural Network Diffusion”的研究,该研究利用扩散模型生成神经网...

RAG开发中常见的12个痛点及解决方案

本文主要探讨了在开发检索增强生成(RAG)系统时可能遇到的九大难题,以及相应的解决策略。这些问题包括内容缺失、遗漏重要文档、脱离上下文的挑战、信息提取...
1 5 6 7 8