大模型

LLM,VLM,模型

“世界模型”大争议:杨立昆狠批Sora不是世界模型,生成式路线注定失败|甲子光年

在AI领域,世界模型的概念至关重要,它指的是机器对世界运作方式的理解和内部表示。最近,OpenAI发布了Sora,一个被定义为“世界模拟器”的视频生成模型,引起...

谈谈AI落地难的问题

在阅读《MLOps工程实践》时,作者回忆起十年前参与网络搭建的经历,思考了AI/ML落地的难题。他提到选择量化交易挑战难度大,AI/ML最能产生经济价值的领域是量...

AI芯片主战场,变了

文章主要讨论了英伟达在人工智能芯片市场的领导地位及其面临的竞争压力。随着人工智能模型在实际应用中的广泛应用,英伟达的数据中心业务逐渐从训练转向推理...

既不用ChatGPT也不是Bard,黄仁勋每天都在用的AI工具咱可能都没听过

本文主要介绍了人工智能(AI)在提高工作效率方面的应用,并以黄仁勋使用的Perplexity AI为例进行了详细阐述。Perplexity AI是一款基于大模型的搜索引擎产品...

字节等待一鸣惊人

近日,字节跳动正式发布了文生图模型SDXL-Lightning,采用了新的渐进式对抗蒸馏技术,显著提高了图像生成的速度和质量,将计算时间和成本降至十分之一。此外...

大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘

本文探讨了大模型性能与训练数据规模、模型架构等设计要素之间的关系,即Scaling Law。研究者们主要关注了迁移学习中的Scaling Law,即预训练数据集大小与任...

MATRIX:社会模拟推动大模型价值自对齐,比GPT4更「体贴」

摘要总结:随着大语言模型(LLMs)的快速发展,如何确保它们与人类价值观对齐,避免社会负面影响成为一个重要议题。本文介绍了上海交通大学和上海人工智能实...

谷歌10M上下文窗口正在杀死RAG?被Sora夺走风头的Gemini被低估了?

Gemini 1.5 Pro 测评摘要:谷歌推出的Gemini 1.5 Pro模型在多模态数据处理方面展现出了显著的能力,尤其是在处理超长上下文方面。该模型能够处理高达100万tok...

端侧最强,Meta田渊栋等人卷10亿以下参数小模型,LeCun:小技巧启动

Meta 推出 MobileLLM 系列,一款适用于移动设备上的「小」模型。Meta 最新论文介绍了 MobileLLM,一款专为移动设备设计的小型语言模型(LLM)。图灵奖得主 Ya...

Mistral AI新模型对标GPT-4,不开源且与微软合作,网友:忘了初心

Mistral AI发布了旗舰级大模型Mistral Large,性能强大,体量巨大,直接对标OpenAI的GPT-4。Mistral AI还推出了聊天助手Le Chat,供人们体验。Mistral Large...
1 347 348 349 350 351 391