大模型

LLM,VLM,模型

刚刚,OpenAI首发语音Agent,智能体实现重大突破

OpenAI在凌晨的技术直播中发布了三款全新的语音模型,分别是GPT-40 Transcribe、GPT-4 Mini Transcribe和GPT-40 Mini TTS。这些模型专注于语音AI Agent的开发...

精彩回顾 | “AI重塑生产力”沙龙成功举办

3月16日,'AI重塑生产力·开启2025新篇章'沙龙在上海云赛空间成功举办,吸引了超过100位AI技术从业者、企业决策者和跨界创新者参与,线上直播观看人数超过1万...

OpenAI深夜发布3个全新的语音模型,一手实测都在这了。

OpenAI近期发布了一系列新的语音和文本处理模型,包括两个语音转文本(STT)模型和一个文本生成语音(TTS)模型。这些模型通过API提供接入方式,旨在提升语音...

硅基流动:关于 DeepSeek-R1 API 的评测,至少有 7 个误区

随着硅基流动等平台上线DeepSeek-R1,市面上出现了大量关于API服务的评测文章,但这些评测往往存在诸多误区,导致结论不一致甚至相互矛盾。评测API服务时,测...

三大模型巨头比拼思考「幻觉」:DeepSeek 不敌 ChatGPT,Gemini 用词最少

智利大学 CIAE 教育研究所的研究员 Roberto Araya 最近进行了一项关于大模型在应对幻觉问题上的性能对比研究,涉及 Gemini 2.0 Flash、ChatGPT o3-mini 和 De...

独家 | 前 TikTok 算法负责人陈志杰创立新公司「言创万物」,聚焦 AI Coding

陈志杰,前TikTok算法负责人,离职后创立了新公司“言创万物”,专注于AI Coding领域。该公司由陈志杰和原百度电商研发负责人刘晓春共同创立,陈志杰持股52.5%...

01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员

字节跳动与清华大学AIR联合实验室SIA Lab近期推出了一种名为DAPO的强化学习(RL)算法,该算法在AIME 2024基准测试中表现优异,超越了DeepSeek的GRPO算法。DA...

OpenAI加码写作赛道?阿里最新大模型通用写作能力基准WritingBench,揭秘深度思考能否增进文学表达

阿里研究团队联合中国人民大学和上海交通大学共同开发了WritingBench,这是一个全面评估大模型生成式写作能力的基准。该基准覆盖了六大领域和100个细分场景,...

一个算法让LLM创新能力暴增,原来是AI学会了进化

实验结果表明,Lluminate在纹理动画和时钟设计领域显著提升了新颖性。研究者通过比较不同配置的最终种群新颖性和基因组长度,发现使用进化提示词模式的变化(...

如何为预训练 LLM 添加新 token?

在预训练大模型(LLM)的微调过程中,添加新的 token 是提升模型在特定领域表现的关键步骤。这一操作不仅能够帮助模型更好地理解领域特定词汇,还能提高文本...
1 137 138 139 140 141 314