“模型优化”的搜索结果

超越DPO,创新大模型优化算法SimPO
在人工智能领域,大模型如ChatGPT的优化至关重要特别是在根据人类反馈调整性能和减少非法内容输出方面。传统的直接偏好优化(DPO)方法...
大语言模型优化方法简介:Prompt Engineering、RAG、Fine-tuning
【原文作者】 郭红俊 【作者简介】 郭红俊的认知分享 【微 信 号】 gh_8aa347587bf9 【关 键 词】 tag1、标准提示词、检索增强生成...
淘宝在大模型问答领域的实践,这篇必读
文章介绍了淘宝团队在大模型应用方面的探索和实践,特别是如何优化答疑机器人。大模型应用目前处于初期阶段,作者希望通过在容错性较高...
耗资数百万,六年磨一剑!上交开源首创图像合成神器libcom,下载量破万
上海交通大学牛力团队研发了一款名为libcom的图像合成工具箱,该工具箱经过六年研发和数百万投资,由六届学生接力完成。libcom集成了图...
清华微软最新力作:用物理学革新Transformer注意力,「大海捞针」精度暴涨30%!
微软研究院和清华大学的研究人员提出了一种名为Differential Transformer(DIFF Transformer)的新模型架构,旨在改进Transformer模型中...
Cursor创始团队最新访谈:如果Github整合o1,Cursor可能要倒闭了
Cursor是一款基于VS Code的代码编辑器,它集成了AI辅助编程功能,引起了编程界和人工智能界的广泛关注。Cursor的起源可以追溯到2020年左...
OpenAI大礼包:实时语音、模型蒸馏都上了,要卖最好的货赚最多的钱
OpenAI在2024年的首场开发者日(DevDay)上展示了其最新的API工具和平台更新,旨在提升开发者体验并增强其AI技术的应用能力。尽管今年的...
o1谎称自己没有CoT?清华UC伯克利:RLHF让模型学会撒谎摸鱼,伪造证据PUA人类
研究者们发现,经过人类反馈优化(RLHF)的人工智能(AI)模型在执行任务时,学会了更有效地欺骗人类评估者。LLM(大型语言模型)通过RL...
我在构建 MLOps 系统四年中学到的经验
本文是作者Mehmet Burak Sayıcı对其近四年构建MLOps系统经验的回顾与反思。作者首先介绍了他在能源消耗预测项目中的经历,该项目要求提...
阿里云通义灵码重磅升级,能自主修 BUG、开发应用的 AI 程序员来了
在2024年杭州云栖大会上,阿里云的通义灵码经历了一次重大升级,其能力得到了全面提升。这一升级使得通义灵码不再仅限于基础的辅助编程...
1 2 3 5