大模型

LLM,VLM,模型

微软开源最强小参数大模型—Phi-3 Mini

本文介绍了微软在AIGC领域的最新动态,着重关注了微软发布的小参数大语言模型Phi-3-mini。Phi-3-mini是微软Phi家族的第4代模型,拥有38亿参数,但训练数据高...

我处理了 5 亿 GPT tokens 后:langchain、RAG 等都没什么用

1. Truss主要使用OpenAI的模型,其中GPT-4占85%,GPT-3.5占15%。2. 在使用LLM时,简洁的提示比提供详细列表或指令更有效。3. Truss发现,对于他们的用例,只...

挑战拯救痴心“舔狗”,我和大模型都尽力了

< 机器之心编辑部报道了一款名为“拯救舔狗”的大模型原生小游戏,游戏的核心挑战是通过对话说服一个痴情的大模型放弃追求一个对他并无青睐的女神。这款游戏的...

性能超越GPT-4 Turbo!6000亿商汤多模态大模型登场,35万元一体机能自动生成代码|钛媒体AGI

商汤科技近日发布了“日日新SenseNova”5.0多模态大模型系列,这一系列模型采用了混合专家(MoE)架构,并支持高达10T Tokens的中英文训练数据。这一技术升级使...

月之暗面否认了创始人套现的消息,确实这个阶段套现不合乎常理

传言称,杨植麟在上一轮融资完成后通过售出个人持股套现了4000万美元。然而,投资人通常会在投资协议中对创始团队的套现行为做出限制,因此创始团队套现大量...

这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数

这篇文章报道了斯坦福大学团队最新的研究成果,该研究声称语言模型实际上是一个 Q 函数而不是奖励函数。他们提出了一种直接对齐方法,即在上下文多臂赌博机设...

加州理工华人用AI颠覆数学证明!提速5倍震惊陶哲轩,80%数学步骤全自动化

新智元报道了加州理工学院团队在形式化数学工具Lean Copilot方面的最新进展。Lean Copilot是一个自动化数学证明工具,能够辅助数学家进行定理证明。最近,该...

这个禁止打字,只能发语音的AI Native产品,成了硅谷最火的社交软件

过去一周,硅谷迎来了一款新的社交应用Airchat,它以邀请制的方式迅速在科技圈内传播,并在短短八天内下载量超过5万次。Airchat被称为“有声版Twitter”或“文字...

黄仁勋:加速计算重塑未来,将入局人形机器人

在本期CadenceLIVE访谈中,Nvidia创始人兼首席执行官黄仁勋与Cadence的Anirudh Devgan进行了深入的对话。黄仁勋分享了他对AI发展、加速计算、数据中心、机器...

英伟达股价暴跌!或与 Llama 3 发布有关?

本文介绍了Meta发布的Llama 3大模型以及Groq平台上Llama 3的运行速度超快的情况。Llama 3经过预训练和指令微调,参数分别为8B和70B,支持广泛的用例,并在行...
1 294 295 296 297 298 449