大模型

LLM,VLM,模型

01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员

字节跳动与清华大学AIR联合实验室SIA Lab近期推出了一种名为DAPO的强化学习(RL)算法,该算法在AIME 2024基准测试中表现优异,超越了DeepSeek的GRPO算法。DA...

OpenAI加码写作赛道?阿里最新大模型通用写作能力基准WritingBench,揭秘深度思考能否增进文学表达

阿里研究团队联合中国人民大学和上海交通大学共同开发了WritingBench,这是一个全面评估大模型生成式写作能力的基准。该基准覆盖了六大领域和100个细分场景,...

一个算法让LLM创新能力暴增,原来是AI学会了进化

实验结果表明,Lluminate在纹理动画和时钟设计领域显著提升了新颖性。研究者通过比较不同配置的最终种群新颖性和基因组长度,发现使用进化提示词模式的变化(...

如何为预训练 LLM 添加新 token?

在预训练大模型(LLM)的微调过程中,添加新的 token 是提升模型在特定领域表现的关键步骤。这一操作不仅能够帮助模型更好地理解领域特定词汇,还能提高文本...

史上最贵 API!比 DeepSeek-R1 贵千倍,OpenAI 高价劝退一批用户!

OpenAI最近推出了o1-pro API,这是其o1“推理”系列模型的更强大版本,旨在提供更优的回答。该模型使用了更多的计算资源,但目前仅对在OpenAI API服务上花费至...

被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界

群核科技近期开源了空间理解模型SpatialLM,该模型通过视频理解物理世界的几何关系,并将其转化为机器能读懂的指令,相当于教会机器用人类直觉感知世界。Spat...

独家提问黄仁勋:CUDA不会受到开源冲击;英伟达不再是“卖芯片的”,它是全世界的根基

在GTC主题演讲后的对话中,英伟达创始人兼CEO黄仁勋深入探讨了AI技术、芯片行业以及数据中心的未来发展方向。他强调,今年的GTC标志着英伟达从一家计算机技术...

英伟达开源通用机器人大模型—GR00T N1

全球AI领导者英伟达在“GTC 2025”开发者大会上宣布开源人形机器人通用大模型GR00T N1,该模型能够处理多模态数据,包括语言、图像和视频,适用于家务、工厂等...

比DeepSeek、o1高3倍!首创无服务器强化微调,只需十几个数据点,

知名大模型训练与开发平台Predibase发布了首个端到端强化微调平台(RFT),这一平台通过奖励函数和自定义函数实现持续强化学习,无需依赖大量标注数据。与传...

Claude准备再做一款AI应用

Anthropic 这家 AI 初创公司正在积极探索新的商业路径,专注于为企业用户开发提效产品,旨在帮助那些日常忙于会议、处理 Excel 表格或编辑 Google Docs 的员...
1 61 62 63 64 65 590