标签:模型优化
Stable diffusion 3 正式开源
Stability AI近日宣布开源其文生图片模型——Stable Diffusion 3 Medium(简称SD3-M)。该模型拥有20亿参数,在保证高推理效率的同时,对硬件需求较低,适合在P...
超越DPO,创新大模型优化算法SimPO
在人工智能领域,大模型如ChatGPT的优化至关重要特别是在根据人类反馈调整性能和减少非法内容输出方面。传统的直接偏好优化(DPO)方法依赖于参考模型,存在...
Meta等最新研究:多token预测,提升大模型推理效率
在自然语言处理领域,大语言模型如GPT-4、Gemini系列和Llama-3等,通常采用下一个token预测的损失函数进行预训练。然而,这种预训练方法需要大量数据且可能降...
英伟达推出NIM,可优化推理以实现大规模AI模型部署
本文介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。ChatGPT的出现加速了生成式AI...
能在手机上运行,仅仅0.5B大小的小语言模型MobiLlama
本文介绍了MobiLlama模型,这是一个基于LLaMA-7B架构设计的轻量级语言模型,旨在在边缘设备上高效运行,无需将数据发送到远程服务器或云端处理。MobiLlama模...
大模型时代Text-to-SQL技术在金融领域的实践
一、Text2SQL介绍Text2SQL(自然语言转SQL)技术将用户的自然语言文本转化为SQL语言,用于查询关系型数据库。该技术常被称为NL2SQL,其典型任务形式是将自然...