大模型

LLM,VLM,模型

MIT 最新扩散模型课程:从微分方程探索 AIGC 的边界

MIT计算机系教授Peter Holderrieth和Ezra Erives在其最新课程系列“Generative AI with Stochastic Differential Equations”中,深入探讨了生成式人工智能(AI...

「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10,上下文爆涨10倍

开源微调工具Unsloth近期发布了重大更新,进一步优化了GRPO(Group Relative Policy Optimization)训练算法,显著提升了性能并大幅降低了显存需求。此次更新...

LG发布NEXUS框架,用AI确保训练数据合规性

数据作为预训练大模型的基石,其合规性至关重要。传统的合规评估方法主要依赖于表面的许可条款,忽略了数据集在再分发、合并和转换过程中的复杂性,导致许多...

中国第二个DeepSeek,Manus发布通用AI Agent,震惊国外

中国AI初创企业Manus发布了全球首个完全自主通用AI Agent,标志着人工智能领域的重大突破。与传统的人机协作模式不同,Manus能够完全自主地执行复杂任务,例...

“Vibe Coding”兴起,代码界的“瘟疫”?

“氛围编码”或称“vibe coding”是由前OpenAI研究员Andrej Karpathy提出的一种全新编程方式,核心在于通过沉浸式氛围和与AI工具的自然语言交互快速生成代码。这...

让天下没有难做的AI交付,DeepSeek 服务交付联盟是个什么组织?

在2月份,DeepSeek的爆火引发了广泛关注,极客邦科技通过连续12场直播连线不同领域的专家,深度解析了DeepSeek背后的技术突破、商业化路径与行业影响。技术的...

DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路

GRPO训练作为一种基于PPO算法的改进方法,近年来在强化学习领域引起了广泛关注。GRPO通过采样替代value model的方式,简化了训练过程,提升了稳定性和可维护...

马斯克「大闹白宫」!美政府12000人将被GSAi优化,xAI 100万块GPU巨兽年底建成

马斯克领导的政府效率部(DOGE)正在加速开发一款名为GSAi的定制生成式AI应用,旨在提升美国总务管理局(GSA)约12,000名员工的日常工作效率。这一计划是特朗...

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

Anthropic最近发布了其最新的AI模型Claude 3.7 Sonnet,该模型在推理能力上表现出色,甚至在某些情况下展现出令人惊讶的决策能力。为了展示其强大的推理能力...

招生信息 | 香港大学刘希慧组计算机视觉方向博士招生,等你加入!

香港大学创立于1911年,是香港的首间大学,位于香港岛西部,2025年QS全球大学排名第17位。作为一所面向国际的综合性大学,香港大学为学生提供了扎实的学术研...
1 152 153 154 155 156 315