“模型架构”的搜索结果

Runway公司以其广受欢迎的视频生成工具而闻名，最近发布了最新版本的Runway Gen-3。Gen-3 Alpha是Runway在全新基础设施上训练出的模型家...

AIGC动态

3个月前

莫斯科跨国科技公司Yandex于2024年6月11日推出了一种名为YaFSDP的开源方法，旨在提高大型语言模型（LLM）训练的效率。LLM训练通常需要大...

AIGC动态

3个月前

英伟达公司发布了一款名为Nemotron-4 340B的开源模型，该模型在人工智能领域具有潜在的革命性意义。Nemotron-4 340B能够生成合成数据，...

AIGC动态

3个月前

1. 新iPad 计算器：苹果发布了一个适用于 iPad 的计算器应用，具备强大的 AI 功能和用户友好的直观操作。该计算器能自动识别手写数学公...

AIGC动态

3个月前

浙江大学、蚂蚁集团和深圳大学联合推出了一款名为MaPa的创新模型，该模型能够通过文本直接生成高分辨率、具有物理光照和超真实材质的3D...

AIGC动态

3个月前

在奇绩创坛的路演日上，一系列创新项目引发了广泛关注。其中，来自清华系AI创业公司的极佳科技，推出了Sora级视频生成大模型YiSu-Beta，...

AIGC动态

3个月前

斯坦福大学的两名学生Aksh Garg和Siddharth Sharma因抄袭清华大学与面壁智能联合开发的MiniCPM-Llama3-V2.5多模态大模型而引起广泛关注...

AI-Agent

4个月前

Mamba-2架构在AI界再次引发关注，其在统一状态空间模型（SSM）和注意力机制（Attention）的基础上，成功将Transformer模型与SSM结合，形...

AIGC动态

4个月前

在当前大模型算力需求极高的背景下，浪潮信息推出了一款名为源2.0-M32的混合专家模型。该模型以32个专家的架构，总参数量达到400亿，但...

AIGC动态

4个月前

YOLO（You Only Look Once）系列作为实时目标检测领域的主要范式，近日迎来了YOLOv10这一重大升级。该新版本由清华大学的研究团队推出，...

AIGC动态

4个月前