大模型
LLM,VLM,模型
阿里云通义灵码重磅升级,能自主修 BUG、开发应用的 AI 程序员来了
在2024年杭州云栖大会上,阿里云的通义灵码经历了一次重大升级,其能力得到了全面提升。这一升级使得通义灵码不再仅限于基础的辅助编程任务,而是能够通过简...
投资等于捐赠!?65 亿美元已经砸给 OpenAI,微软、苹果、英伟达争夺入场券,最新估值 1500 亿美元创历史
OpenAI即将完成新一轮融资,预计投资者将出资至少2.5亿美元。该公司的融资已经超额认购,显示出投资者的极大兴趣。微软、英伟达和苹果等战略投资者有望参与此...
强化学习让大模型自动纠错,数学、编程性能暴涨,DeepMind新作
在大语言模型(LLM)的研究领域,自我纠正能力一直是一个重要的研究方向。然而,现有的自我纠正训练方法通常依赖于多个模型或额外的监督,这限制了其实用性。...
o1核心作者演讲:激励AI自我学习,比试图教会AI每一项任务更重要
OpenAI研究科学家Hyung Won Chung在MIT的演讲中提出了一个关于人工智能发展的新范式,即“不要教,要激励”。他认为,激励AI自我学习比直接教授具体任务更为重...
阿里云和JetBrains合作推出基于通义大模型的AI Assistant|钛媒体AGI
在2024年云栖大会期间,阿里云与全球软件开发工具提供商JetBrains宣布达成合作,并发布了基于阿里云通义大模型的JetBrains AI Assistant。这一合作标志着JetB...
英伟达 Jim Fan:复刻 NLP 的成功路,用通用模型开启具身智能的 GPT-3 时刻
在机器人技术飞速发展的今天,英伟达的高级科学家Jim Fan及其团队在具身智能领域的研究取得了显著进展。他们开发的四足机器人Unitree Go1能够自如地在瑜伽球...
AI创业出海,听听谷歌、真格基金和红杉中国怎么说
在当前AI技术快速发展的背景下,AI创业领域呈现出新的发展趋势和机遇。随着基础大模型能力的不断进步,AI创业的商业落地和付费环境在国内外存在显著差异,海...
o1带火的CoT到底行不行?新论文引发了论战
近期,德克萨斯大学奥斯汀分校、约翰·霍普金斯大学和普林斯顿大学的研究人员提出了一个关键问题:在大型语言模型(LLM)中,是否应该使用思维链(Chain-of-Th...
万字长文解析OpenAI o1 Self-Play RL技术路线
OpenAI最近推出的Self-Play RL新模型o1在数理推理领域取得了显著成绩,并提出了train-time compute和test-time compute两个新的RL Scaling Law。o1是一个多模...
一口气发 100 个开源模型、主力模型再大降价!阿里:不然谈什么应用爆发?!
在最近的云栖大会上,阿里巴巴展示了其在人工智能领域的最新进展,特别是通过发布新一代开源模型Qwen2.5,以及对现有模型进行大幅降价,进一步推动了大模型技...