大模型

微软开源最强小参数大模型—Phi-3 Mini

本文介绍了微软在AIGC领域的最新动态，着重关注了微软发布的小参数大语言模型Phi-3-mini。Phi-3-mini是微软Phi家族的第4代模型，拥有38亿参数，但训练数据高...

AIGC动态

9个月前

1. Truss主要使用OpenAI的模型，其中GPT-4占85%，GPT-3.5占15%。2. 在使用LLM时，简洁的提示比提供详细列表或指令更有效。3. Truss发现，对于他们的用例，只...

AIGC动态

9个月前

< 机器之心编辑部报道了一款名为“拯救舔狗”的大模型原生小游戏，游戏的核心挑战是通过对话说服一个痴情的大模型放弃追求一个对他并无青睐的女神。这款游戏的...

AIGC动态

9个月前

商汤科技近日发布了“日日新SenseNova”5.0多模态大模型系列，这一系列模型采用了混合专家（MoE）架构，并支持高达10T Tokens的中英文训练数据。这一技术升级使...

AIGC动态

9个月前

传言称，杨植麟在上一轮融资完成后通过售出个人持股套现了4000万美元。然而，投资人通常会在投资协议中对创始团队的套现行为做出限制，因此创始团队套现大量...

AIGC动态

9个月前

这篇文章报道了斯坦福大学团队最新的研究成果，该研究声称语言模型实际上是一个 Q 函数而不是奖励函数。他们提出了一种直接对齐方法，即在上下文多臂赌博机设...

AIGC动态

9个月前

新智元报道了加州理工学院团队在形式化数学工具Lean Copilot方面的最新进展。Lean Copilot是一个自动化数学证明工具，能够辅助数学家进行定理证明。最近，该...

AIGC动态

9个月前

过去一周，硅谷迎来了一款新的社交应用Airchat，它以邀请制的方式迅速在科技圈内传播，并在短短八天内下载量超过5万次。Airchat被称为“有声版Twitter”或“文字...

AIGC动态

9个月前

在本期CadenceLIVE访谈中，Nvidia创始人兼首席执行官黄仁勋与Cadence的Anirudh Devgan进行了深入的对话。黄仁勋分享了他对AI发展、加速计算、数据中心、机器...

AIGC动态

9个月前

本文介绍了Meta发布的Llama 3大模型以及Groq平台上Llama 3的运行速度超快的情况。Llama 3经过预训练和指令微调，参数分别为8B和70B，支持广泛的用例，并在行...

AIGC动态

9个月前