大模型
LLM,VLM,模型
刚刚,OpenAI首发语音Agent,智能体实现重大突破
OpenAI在凌晨的技术直播中发布了三款全新的语音模型,分别是GPT-40 Transcribe、GPT-4 Mini Transcribe和GPT-40 Mini TTS。这些模型专注于语音AI Agent的开发...
精彩回顾 | “AI重塑生产力”沙龙成功举办
3月16日,'AI重塑生产力·开启2025新篇章'沙龙在上海云赛空间成功举办,吸引了超过100位AI技术从业者、企业决策者和跨界创新者参与,线上直播观看人数超过1万...
OpenAI深夜发布3个全新的语音模型,一手实测都在这了。
OpenAI近期发布了一系列新的语音和文本处理模型,包括两个语音转文本(STT)模型和一个文本生成语音(TTS)模型。这些模型通过API提供接入方式,旨在提升语音...
硅基流动:关于 DeepSeek-R1 API 的评测,至少有 7 个误区
随着硅基流动等平台上线DeepSeek-R1,市面上出现了大量关于API服务的评测文章,但这些评测往往存在诸多误区,导致结论不一致甚至相互矛盾。评测API服务时,测...
三大模型巨头比拼思考「幻觉」:DeepSeek 不敌 ChatGPT,Gemini 用词最少
智利大学 CIAE 教育研究所的研究员 Roberto Araya 最近进行了一项关于大模型在应对幻觉问题上的性能对比研究,涉及 Gemini 2.0 Flash、ChatGPT o3-mini 和 De...
独家 | 前 TikTok 算法负责人陈志杰创立新公司「言创万物」,聚焦 AI Coding
陈志杰,前TikTok算法负责人,离职后创立了新公司“言创万物”,专注于AI Coding领域。该公司由陈志杰和原百度电商研发负责人刘晓春共同创立,陈志杰持股52.5%...
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
字节跳动与清华大学AIR联合实验室SIA Lab近期推出了一种名为DAPO的强化学习(RL)算法,该算法在AIME 2024基准测试中表现优异,超越了DeepSeek的GRPO算法。DA...
OpenAI加码写作赛道?阿里最新大模型通用写作能力基准WritingBench,揭秘深度思考能否增进文学表达
阿里研究团队联合中国人民大学和上海交通大学共同开发了WritingBench,这是一个全面评估大模型生成式写作能力的基准。该基准覆盖了六大领域和100个细分场景,...
一个算法让LLM创新能力暴增,原来是AI学会了进化
实验结果表明,Lluminate在纹理动画和时钟设计领域显著提升了新颖性。研究者通过比较不同配置的最终种群新颖性和基因组长度,发现使用进化提示词模式的变化(...
如何为预训练 LLM 添加新 token?
在预训练大模型(LLM)的微调过程中,添加新的 token 是提升模型在特定领域表现的关键步骤。这一操作不仅能够帮助模型更好地理解领域特定词汇,还能提高文本...