大模型
LLM,VLM,模型
再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升
自2017年提出以来,Transformer架构在AI大模型领域占据了主导地位,尤其是在语言建模方面。然而,随着模型规模的扩大和序列长度的增加,其局限性也逐渐凸显,...
新架构Mamba更新二代!作者:别争了,数学上Transformer和SSM是一回事
研究人员推出了Mamba-2模型,该模型在状态空间模型(SSM)与Transformer架构之间建立了新的联系。通过对两种模型的数学基础进行深入分析,研究团队发现,尽管...
终于来啦!Stable Diffusion 3将在6月12日正式开源
在人工智能生成内容(AIGC)领域,Stable Diffusion模型由开源大模型平台Stability AI开发,一直备受关注。6月3日,Stability AI的联合首席执行官Christian L...
Adobe推出超分辨率,细节丰富视频模型VideoGigaGAN
视频超分辨率技术致力于将低分辨率视频转化为高分辨率,面临两大挑战:一是保持视频帧的时间连贯性,避免闪烁或抖动;二是放大视频帧时重建高频细节,以呈现...
我们跟一线 AI 开发者聊了聊,发现中国开源生态已经在全球找到了自己的位置
在中国开源社区在大语言模型领域的全球角色和贡献的直播讨论中,多位嘉宾分享了他们的观点和发现。以下是对讨论内容的分段摘要:中国开源社区的全球角色中国...
斯坦福Llama3-V抄袭面壁智能被迫认错,开源社区:这就是忽视中国模型的后果
在人工智能领域,一场关于开源大模型的争议近日在学界和社交媒体上引发热议。事件的起因是斯坦福AI团队发布的名为“Llama 3-V”的模型,该模型声称在性能上能够...
黄仁勋最新主题演讲:Blackwell 芯片将打破摩尔定律,解决大模型耗电难题
在2024年台北国际电脑展上,英伟达创始人黄仁勋发表了主题演讲,揭示了人工智能时代如何推动全球新产业革命。他介绍了最新的Blackwell芯片,并宣称这是全球最...
清北爸爸李永乐都搞不定的事情,这个隐身的大模型在发起挑战
本文讨论了当前教育领域大模型的发展以及猿辅导在这一领域的探索。首先,文章提到许多家长在辅导孩子作业时感到困难,而一些AI大模型如ChatGPT虽然可以提供答...
斯坦福AI团队“套壳”清华系开源大模型被实锤!被揭穿后全网删库跑路
斯坦福团队在Medium发布的文章中宣称,他们训练出了一个小型多模态模型Llama 3-V,其性能超越了GPT-4V、Gemini Ultra和Claude Opus等模型,且尺寸只有GPT4-V...
斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库
在GPT-4o问世后,Llama3的地位受到挑战。然而,斯坦福团队推出的Llama3-V引发关注,这一模型以仅500美元的成本,实现了与GPT4-V、Gemini Ultra和Claude Opus...