标签:预训练

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

斯坦福大学的研究团队在多模态语言模型领域取得了新进展,提出了一种能够同时处理语音、文本和动作生成任务的模型。该模型能够理解并生成富有表现力的人类动...

Ilya Sutskever 在 NeurIPS 2024 的演讲:预训练时代已经结束了

在NeurIPS 2024会议上,Safe SuperIntelligence实验室创始人、原OpenAI联合创始人兼首席科学家Ilya Sutskever发表了题为《Sequence to sequence learning wit...

OpenAI附议Ilya预训练终结!“但Scaling Law还没死”

在最近举行的NeurIPS会议上,OpenAI的核心成员Noam Brown提出了关于预训练终结和Scaling Law的讨论,引发了广泛关注。Brown指出,从2019年至今,AI领域的巨大...

王小川:AI医疗,代表了 AGI 之后更大的世界

百川智能作为一家专注于医疗领域的大模型创业公司,其创始人王小川在极客公园IF2025创新大会上分享了他对医疗方向、AGI(人工通用智能)及技术进程的深入思考...

李开复为什么这么忙

李开复,作为零一万物的创始人,近期日程繁忙,频繁参与国内外重要活动和公开演讲,成为外界观察明星公司现状的重要窗口。他以高强度的工作状态,平均每天仅...

李开复:最新预训练模型Yi-Lightning超越GPT-4o,中美顶尖模型只差5个月|钛媒体AGI

零一万物创始人李开复近日宣布推出新的旗舰预训练模型Yi-Lightning“闪电模型”,在国际权威盲测榜单LMSYS上排名世界第六,中国第一,超越了OpenAI GPT-4o-2024...

张俊林:OpenAI o1的价值意义及强化学习的Scaling Law

张俊林在其文章中对OpenAI的o1模型进行了深入分析,认为这是自GPT-4以来大模型领域的一个重要进步。o1模型在逻辑推理能力上的提升,使其在发展大模型的不同方...

苹果在小模型上还是非常领先的

AI领域中,小模型技术越来越受欢迎,因为这些模型可以在个人设备上运行,无需依赖云端大型数据中心。苹果最近推出了OpenELM项目,包括一系列小型AI语言模型,...

3个月砸1000万美元肝出“最强”大模型?黑马Databricks:我们完虐Grok、Llama,还更开放

美国AI初创公司Databricks近日宣布,其Mosaic Research团队开发的通用大模型DBRX将开源。DBRX的设计灵感来源于OpenAI的ChatGPT,Databricks表示,它花费了大...

Stability AI开源3B代码生成模型:可补全,还能Debug

本文报道了Stability AI 公司开源的小体量预训练模型 Stable Code Instruct 3B,该模型是一个基于 Stable Code 3B 的指令调整编码语言模型,能够处理各种任务...
1 2