“ICLR 2024”的搜索结果

o1方法性能无上限!姚班马腾宇等数学证明:推理token够多,就能解决任意问题
在最新的研究中,斯隆奖得主马腾宇和Google Brain推理团队创建者Denny Zhou联合证明了Transformer模型在引入思维链(Chain of Thought, ...
早半年发arXiv,却被质疑抄袭:活在微软AutoGen阴影里的CAMEL
微软的AutoGen是一个开源编程框架,用于构建AI智能体,允许多个智能体通过聊天解决任务。这个项目在GitHub上获得了28k的star量,并在ICL...
百万tokens低至1元!大模型越来越卷了
智谱AI在ICLR 2024大会上公布了面向AGI通用人工智能前景的三大技术趋势,并预告了GLM的后续升级版本。同时,智谱大模型开放平台上线了新...
国产大模型:今天起,我们100万tokens只需1元!
智谱AI,一家国内的大模型开发商,近期在顶级会议ICLR上作为特邀演讲嘉宾后,紧接着宣布了其大模型开放平台的价格调整:1元人民币可兑换...
智子引擎发布多模态大模型 Awaker:MOE、自主更新、写真视频效果优于 Sora
这个模型采用了MOE架构,并具备了业界首个「真正」自主更新的能力。其性能在写真视频生成上超过了Sora模型,有望解决大模型在实际应用中...
超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题
本文介绍了由智子引擎团队研发的多模态大模型Awaker 1.0,该模型在多模态任务中表现出色,特别是在数据生成和模型自主更新方面具有创新...
人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora
在4月27日的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎发布了全新的多模态大模型Awaker 1.0,标志着向通用人工智能(AG...
AI每日精选摘要
❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️ ◈ 09月19日 星...
AI顶会ICML收了一篇论文:没算法没实验
2024年国际机器学习会议(ICML)的Spotlight环节中,一篇名为“词的万能逼近:从语言角度看映射组合”的纯理论论文脱颖而出,成为唯一一篇...
Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍
Mamba-2架构在AI界再次引发关注,其在统一状态空间模型(SSM)和注意力机制(Attention)的基础上,成功将Transformer模型与SSM结合,形...
1 2 3 4