“优化算法”的搜索结果

超越DPO,创新大模型优化算法SimPO
在人工智能领域,大模型如ChatGPT的优化至关重要特别是在根据人类反馈调整性能和减少非法内容输出方面。传统的直接偏好优化(DPO)方法...
博士/访问学生/学者申请|新加坡管理大学(SMU)周攀助理教授:机器学习、计算机视觉、优化算法方向
这篇文章介绍了新加坡管理大学计算机与信息系统学院助理教授周攀的招生信息和研究方向。周攀教授的研究方向包括神经网络结构设计、学习...
提供具身智能训练场,北电数智以“星火智算+”打通数据和场景
2024年,人工智能行业迎来了关键的发展时期,其中具身智能成为了最受瞩目的领域之一。随着基础模型的突破,通用智能机器人(具身智能)...
工业制造的智能化转型:从传统决策到运筹优化
随着工业智能化和数字化转型的推进,制造业企业决策管理面临复杂挑战。传统人工经验决策模式难以适应多品种、小批量生产需求,智能决策...
抖音第一年:30 日留存只有 8%
抖音在2017年初期面临挑战,30日留存率仅为8%,日活跃用户(DAU)500万,使用时长22分钟,与竞争对手火山视频和musical.ly相比数据表现...
昆仑万维开源 2 千亿稀疏大模型天工 MoE,全球首创能用 4090 推理
昆仑万维宣布开源其千亿稀疏大模型Skywork-MoE,此模型基于先前的Skywork-13B模型中间checkpoint扩展而成,是首个将MoE Upcycling技术应...
全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型
为使大型语言模型(LLM)与人类价值观和意图保持一致,学习人类反馈是关键。近期研究提出了一种简单有效的离线偏好优化算法——SimPO。Sim...
一文读懂:GPU是如何工作的?
根据文章内容的详细介绍和分析,我总结了以下关键观点:1. GPU的工作原理是通过大量并行线程来加速计算,特别适合于执行大量重复性高的...
李开复:不参与“价格战”、模型盲测国内第一欢迎PK
在LMSYS盲测竞技场最新排名中,零一万物公司推出的千亿参数模型Yi-Large取得了显著成绩,总榜排名世界第七,中国大模型中位列第一。该模...
在对齐 AI 时,为什么在线方法总是优于离线方法?
在人工智能对齐领域,在线方法和离线方法在性能上存在显著差异。DeepMind的最新研究通过实证剖析,探讨了在线算法普遍优于离线算法的根...
1 2