标签:模型优化
我在构建 MLOps 系统四年中学到的经验
本文是作者Mehmet Burak Sayıcı对其近四年构建MLOps系统经验的回顾与反思。作者首先介绍了他在能源消耗预测项目中的经历,该项目要求提前24小时预测八个城市...
o1核心作者演讲:激励AI自我学习,比试图教会AI每一项任务更重要
OpenAI研究科学家Hyung Won Chung在MIT的演讲中提出了一个关于人工智能发展的新范式,即“不要教,要激励”。他认为,激励AI自我学习比直接教授具体任务更为重...
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
CoT(Chain of Thought)作为一种新兴的人工智能技术,已经在自然语言处理(NLP)领域引起了广泛关注。CoT的核心思想是通过在模型的输入和输出之间插入一系列...
成立 5 年融资近 10 亿元 ,这家AI创企将被英伟达收入囊中!AI 大佬趣评:估值应该仅能让投资人回本
英伟达计划以约1.65亿美元收购AI初创公司OctoAI,这是一家致力于提升人工智能模型运行效率的软件销售公司。OctoAI成立于2019年,由华盛顿大学计算机科学与工...
o1突发内幕曝光?谷歌8月论文已揭示原理,大模型光有软件不存在护城河
谷歌DeepMind的一篇论文揭示了一种新的计算策略,该策略与OpenAI的o1模型的工作方式几乎一致。这项研究指出,在测试时增加计算比扩展模型参数更有效,这使得...
Andrej Karpathy最新激进观点:Transformer将超越人脑
Andrej Karpathy,前OpenAI成员及特斯拉自动驾驶计算机视觉团队领导者,近期在播客节目No Priors中分享了他对AI未来的激进观点。Karpathy认为,Transformer模...
视频生成控制提升几十倍,新一代轻量级ControlNeXt火了,贾佳亚团队正挑战Scaling Law
ControlNeXt是一款由思谋科技创始人贾佳亚团队开发的图像和视频生成控制工具,它在生成速度、精准控制和用户友好性方面进行了全方位优化。相较于斯坦福大学研...
对话 Nexa AI:两位斯坦福95后,做出比GPT-4o快4倍的小模型,直指“端侧版Hugging Face”
Nexa AI,一家由斯坦福校友创立的公司,近期在人工智能领域取得了显著成就。公司开发的Octopus v2模型以其5亿参数量在硅谷AI界引起了广泛关注,其Functional ...
DeepSeek开源数学大模型,高中、大学定理证明新SOTA
数学家陶哲轩在牛津数学公开讲座中提出,人工智能(AI)与数学的结合将推动形式化证明的编写超越人类,这不仅将验证现有证明,还将创造新的数学知识。AI在形...
成本直降90%、延迟缩短80%!Anthropic将API玩出了新花样,网友:应该成为行业标配
Anthropic公司在其API中引入了一项创新功能——提示词缓存,旨在显著降低长提示的成本和延迟。该功能通过记住API调用之间的上下文,帮助开发人员避免重复输入相...