“模型架构”的搜索结果

Runway 全新 Gen-3 视频生成模型获网友盛赞:比 Sora 更好
Runway公司以其广受欢迎的视频生成工具而闻名,最近发布了最新版本的Runway Gen-3。Gen-3 Alpha是Runway在全新基础设施上训练出的模型家...
Yandex 开源 LLM 训练工具,可节省高达 20% 的 GPU 资源
莫斯科跨国科技公司Yandex于2024年6月11日推出了一种名为YaFSDP的开源方法,旨在提高大型语言模型(LLM)训练的效率。LLM训练通常需要大...
英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o
英伟达公司发布了一款名为Nemotron-4 340B的开源模型,该模型在人工智能领域具有潜在的革命性意义。Nemotron-4 340B能够生成合成数据,...
苹果的大模型冲刺:没有 AI 新产品,只有新功能
1. 新iPad 计算器:苹果发布了一个适用于 iPad 的计算器应用,具备强大的 AI 功能和用户友好的直观操作。该计算器能自动识别手写数学公...
浙大、蚂蚁集团推出MaPa:文本生成超真实3D模型
浙江大学、蚂蚁集团和深圳大学联合推出了一款名为MaPa的创新模型,该模型能够通过文本直接生成高分辨率、具有物理光照和超真实材质的3D...
AI创业酱紫卷?想让陆奇看上眼,挑战个Sora/Transformer再说
在奇绩创坛的路演日上,一系列创新项目引发了广泛关注。其中,来自清华系AI创业公司的极佳科技,推出了Sora级视频生成大模型YiSu-Beta,...
斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目
斯坦福大学的两名学生Aksh Garg和Siddharth Sharma因抄袭清华大学与面壁智能联合开发的MiniCPM-Llama3-V2.5多模态大模型而引起广泛关注...
Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍
Mamba-2架构在AI界再次引发关注,其在统一状态空间模型(SSM)和注意力机制(Attention)的基础上,成功将Transformer模型与SSM结合,形...
马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B
在当前大模型算力需求极高的背景下,浪潮信息推出了一款名为源2.0-M32的混合专家模型。该模型以32个专家的架构,总参数量达到400亿,但...
清华接手,YOLOv10问世:性能大幅提升,登上GitHub热榜
YOLO(You Only Look Once)系列作为实时目标检测领域的主要范式,近日迎来了YOLOv10这一重大升级。该新版本由清华大学的研究团队推出,...
1 2 3 4 5 6 11