“学习”的搜索结果

浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!
实验结果显示,AUTOACT方法在Llama-2 13B和70B基础下训练出的Agent优于其他所有直接提示方法、CoT与Agent方法。在HotpotQA实现了3.77%的...
最新 Hugging Face 强化学习课程(中文版)来啦!
整理的文章的重点内容如下:第一段:介绍了深度强化学习课程 v2.0 的开启,以及课程更新发布在 Hugging Face 官网的信息,感谢人邮老师...
重磅!DeepMind 确信它已经找到了 AGI 的关键:人工智能可以通过模仿你来学习!
这一发现可能引发人工智能行业的一场真正的革命,减少训练算法的大量资源需求,同时大幅提高其解决问题的能力。DeepMind希望他们的工作...
Redis之父说大模型能帮他缩短学习新技术的时间
原文作者:AI大模型实验室 作者简介:关注大模型技术的创新与发展,探索大模型的实际应用,探讨 AI 未来对企业与社会发展的影响。 微信...
大模型步入「推理Scaling」时代,SambaNova如何挑战英伟达的霸主地位?
OpenAI发布的o1模型在AI领域引起了巨大震动,它不仅能够处理复杂问题,还具备出色的通用推理能力。o1模型无需专门训练即可在数学奥赛中...
DenseNet共一作者刘壮官宣新去向,将任普林斯顿大学助理教授
刘壮,DenseNet和ConvNeXt的主要开发者之一,将于2025年9月加入普林斯顿大学计算机科学系担任助理教授。在学术界任职前,他将继续在Meta...
中关村科金:知识源覆盖范围提升10倍的金融大模型实践
在金融行业的数字化转型中,大模型技术正成为创新的新动力,它通过深度学习和大数据分析,正在改变风险评估、客户服务和投资策略。中关...
AI芯片定制时代,将来临
随着人工智能模型的复杂性不断增加,芯片制造商面临着在固定功能加速和可编程加速器之间做出选择的挑战。通用处理器由于不是为特定工作...
Meta版快慢机来了!田渊栋团队整合快慢思考,能走迷宫推箱子
Meta的田渊栋团队最近推出了一款名为Dualformer的新型人工智能模型,该模型能够将快速和慢速思考方式无缝结合,以提高性能并降低成本。D...
丰田、波士顿动力联手开发,实体大型行为模型机器人
丰田与波士顿动力宣布合作开发实体大型行为模型(LBM)机器人,旨在提升Atlas机器人的通用能力和商业化应用。LBM技术通过分析人类互动数...
1 4 5 6 7 8 136