标签:模型优化

AI Agent的基础设施还不健全

生成式人工智能(AI)应用正经历着爆发式增长,广泛应用于多个领域,包括生产力提升、开发、云基础设施管理、媒体消费,以及医疗收入周期管理等。这一增长得...

解码RAG:智谱 RAG 技术的探索与实践

智谱AI长期致力于大模型技术的研究,尤其在RAG(Retrieval-Augmented Generation)应用领域积累了丰富的经验。RAG技术通过Indexing(知识存储)、Retrieval(...

Stable diffusion 3 正式开源

Stability AI近日宣布开源其文生图片模型——Stable Diffusion 3 Medium(简称SD3-M)。该模型拥有20亿参数,在保证高推理效率的同时,对硬件需求较低,适合在P...

超越DPO,创新大模型优化算法SimPO

在人工智能领域,大模型如ChatGPT的优化至关重要特别是在根据人类反馈调整性能和减少非法内容输出方面。传统的直接偏好优化(DPO)方法依赖于参考模型,存在...

Meta等最新研究:多token预测,提升大模型推理效率

在自然语言处理领域,大语言模型如GPT-4、Gemini系列和Llama-3等,通常采用下一个token预测的损失函数进行预训练。然而,这种预训练方法需要大量数据且可能降...

英伟达推出NIM,可优化推理以实现大规模AI模型部署

本文介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。ChatGPT的出现加速了生成式AI...

能在手机上运行,仅仅0.5B大小的小语言模型MobiLlama

本文介绍了MobiLlama模型,这是一个基于LLaMA-7B架构设计的轻量级语言模型,旨在在边缘设备上高效运行,无需将数据发送到远程服务器或云端处理。MobiLlama模...

大模型时代Text-to-SQL技术在金融领域的实践

一、Text2SQL介绍Text2SQL(自然语言转SQL)技术将用户的自然语言文本转化为SQL语言,用于查询关系型数据库。该技术常被称为NL2SQL,其典型任务形式是将自然...