“注意力机制”的搜索结果

比OpenAI的Whisper快50%,最新开源语音模型
生成式AI公司aiOla在其官网开源了一款名为Whisper-Medusa的语音模型,该模型在推理效率上相较于OpenAI的Whisper模型提升了50%。Whisper-...
GenAI下沉到边缘侧,内存和性能如何平衡?
2022年底,ChatGPT的问世让自然语言处理聊天机器人(NLP)的能力受到广泛关注。科技公司开始探索将这一技术应用于产品和客户体验。然而...
智谱的视频模型来了,它远非Sora,但却让这家公司更像OpenAI|对话智谱AI CEO 张鹏
智谱AI旗下的“智谱清言”App于7月26日推出了AI视频生成功能“清影”,面向所有用户开放,无需预约。清影基于智谱自研的视频生成大模型CogVi...
PixVerse V2 登场!一口气生成5个“Sora”,视频生成赛道“卷”飞了
PixVerse V2是爱诗科技推出的一款基于DiT(Diffusion + Transformer)架构的视频生成产品,它在模型能力和产品化效果上都有显著提升。Pi...
斯坦福博士图解AlphaFold 3:超多细节+可视化还原ML工程师眼中的AF3
AlphaFold 3是由谷歌DeepMind开发的人工智能模型,它在生物学和制药领域产生了重大影响,具有潜在的数千亿美元商业价值。AlphaFold 3的...
谷歌推出通用视频模型:能精准分类、定位、检索等
谷歌的研究人员开发了一种名为VideoPrism的通用视频模型,该模型在视频领域的多种任务上展现出了卓越的性能。为了验证VideoPrism的性能...
字节跳动、浙大推出Coin3D:用几何代理,控制3D模型生成
由字节跳动和浙江大学研究人员联合开发的创新模型Coin3D,通过引入几何代理的方式,实现了对3D模型生成过程的交互式控制和指导。该模型...
斯坦福、丰田最新研究,单视频合成多视角模型GCD
在AI视觉领域,重建复杂动态场景是一个极具挑战性的任务。尽管OpenAI的Sora模型能够生成长达一分钟的高质量视频,但其在没有多视角视频...
H100利用率飙升至75%!英伟达亲自下场FlashAttention三代升级,比标准注意力快16倍
FlashAttention-3,一种用于大模型训练和推理的算法,经过一年的开发,已经推出了第三代。这一升级版本在训练速度上实现了1.5至2倍的提...
Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍
FlashAttention-3是针对H100 GPU优化的第三代FlashAttention技术,它在前一代的基础上实现了1.5至2倍的速度提升,将H100 GPU的FLOPs利用...
1 2 3 4 9