标签:开源工具

微软开源视觉GUI智能体:增强GPT-4V能力,超3800颗星

微软研究人员开发了一款名为OmniParser的开源视觉GUI智能体,旨在提升大语言模型(LLM)如GPT-4V在用户界面(UI)识别和操作任务中的表现。OmniParser通过将U...

iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑

谷歌DeepMind发布了Gemma 2家族的三个新成员,包括Gemma 2 2B轻量级模型、ShieldGemma安全内容分类器和Gemma Scope可解释性工具。Gemma 2 2B虽然只有2.6B参数...

还得是开源!潞晨Open-Sora技术路线公开,一键生成16秒720p视频,质量更高训练成本更低

潞晨Open-Sora是一个免费开源的高清视频生成工具,自3月份发布以来,受到了广泛关注。它能够生成720p的高清视频,包括人物肖像、科幻大片、动画以及具有流畅...

五图乱哗:AI 生图横扫初级设计狮

这篇文章介绍了几款AI生图工具,它们通过训练神经网络生成高保真、高分辨率的图像。首先介绍了基于ChatGPT的DALL·E 3,是市面上学习成本最低的图片生成工具,...

加州理工华人用AI颠覆数学证明!提速5倍震惊陶哲轩,80%数学步骤全自动化

新智元报道了加州理工学院团队在形式化数学工具Lean Copilot方面的最新进展。Lean Copilot是一个自动化数学证明工具,能够辅助数学家进行定理证明。最近,该...

全新开源AI代码工具诞生!超越谷歌DeepMind旗下AlphaCode

文章首先介绍了AlphaCodium的诞生背景,它的开发受到了AlphaCode和AlphaCode 2的启发,但已经超越了它们,引起了广泛关注。AlphaCodium采用了流程引擎的方法...

Amphion:用AI创造你的声音,让世界听见。

Amphion为研究人员提供了强大的研究工具,也为工程师们提供了一个实用的开发环境。它在音频、音乐和语音生成领域展现出了雄心,预示着未来的发展方向。通过不...