大模型

再战Transformer！原作者带队的Mamba 2来了，新架构训练效率大幅提升

自2017年提出以来，Transformer架构在AI大模型领域占据了主导地位，尤其是在语言建模方面。然而，随着模型规模的扩大和序列长度的增加，其局限性也逐渐凸显，...

AIGC动态

8个月前

研究人员推出了Mamba-2模型，该模型在状态空间模型（SSM）与Transformer架构之间建立了新的联系。通过对两种模型的数学基础进行深入分析，研究团队发现，尽管...

AIGC动态

8个月前

在人工智能生成内容（AIGC）领域，Stable Diffusion模型由开源大模型平台Stability AI开发，一直备受关注。6月3日，Stability AI的联合首席执行官Christian L...

AIGC动态

8个月前

视频超分辨率技术致力于将低分辨率视频转化为高分辨率，面临两大挑战：一是保持视频帧的时间连贯性，避免闪烁或抖动；二是放大视频帧时重建高频细节，以呈现...

AIGC动态

8个月前

在中国开源社区在大语言模型领域的全球角色和贡献的直播讨论中，多位嘉宾分享了他们的观点和发现。以下是对讨论内容的分段摘要：中国开源社区的全球角色中国...

AIGC动态

8个月前

在人工智能领域，一场关于开源大模型的争议近日在学界和社交媒体上引发热议。事件的起因是斯坦福AI团队发布的名为“Llama 3-V”的模型，该模型声称在性能上能够...

AIGC动态

8个月前

在2024年台北国际电脑展上，英伟达创始人黄仁勋发表了主题演讲，揭示了人工智能时代如何推动全球新产业革命。他介绍了最新的Blackwell芯片，并宣称这是全球最...

AIGC动态

8个月前

本文讨论了当前教育领域大模型的发展以及猿辅导在这一领域的探索。首先，文章提到许多家长在辅导孩子作业时感到困难，而一些AI大模型如ChatGPT虽然可以提供答...

AIGC动态

8个月前

斯坦福团队在Medium发布的文章中宣称，他们训练出了一个小型多模态模型Llama 3-V，其性能超越了GPT-4V、Gemini Ultra和Claude Opus等模型，且尺寸只有GPT4-V...

AIGC动态

8个月前

在GPT-4o问世后，Llama3的地位受到挑战。然而，斯坦福团队推出的Llama3-V引发关注，这一模型以仅500美元的成本，实现了与GPT4-V、Gemini Ultra和Claude Opus...

AIGC动态

8个月前