标签:开源项目

对话VAST创始人宋亚宸:神学爱好者创业,做出被马斯克转发的3D大模型

VAST是一家成立于2023年3月的AI公司,专注于通用3D大模型的研发。公司的目标是打造一个大众级别的3D内容创作工具,并建立一个3D UGC内容平台,使3D空间智能成...

用Mac训练个机器人叠衣服,HuggingFace开源全套教程,开源AI机器人革命要来了?

HuggingFace机器人科学家Remi Cadene展示了一个令人瞩目的成果:仅需100条轨迹数据和在Mac上训练数小时,便能训练出一个能够抓取乐高积木的机械臂。这一成就...

比OpenAI的Whisper快50%,最新开源语音模型

生成式AI公司aiOla在其官网开源了一款名为Whisper-Medusa的语音模型,该模型在推理效率上相较于OpenAI的Whisper模型提升了50%。Whisper-Medusa在Whisper的基...

Meta开源用于数学等复杂推理AI Agent—HUSKY

由Meta、华盛顿大学和阿伦AI实验室联合开发的HUSKY,是一款专注于数学和表格等复杂推理任务的AI Agent。HUSKY的创新之处在于其统一的行动空间设计,允许AI在...

大模型,再一次爆发!

AI大模型技术已成为互联网巨头公司如Google、百度、腾讯等的热门话题,这些公司正在积极布局人工智能技术和市场。AI大模型人才需求巨大,算法相关岗位薪资待...

8 人团队的开源多模态:Moshi,效果堪比 GPT-4o,合成数据立功

法国非营利性AI研究机构Kyutai开发了一个名为Moshi的实时语音多模态模型,该模型具备听、说、看的能力,能够理解带有法国口音的英语。Moshi可以流畅地进行日...

微软开源GraphRAG:极大增强大模型问答、摘要、推理

7月3日,微软在其官网开源了GraphRAG,这是一种基于图的检索增强生成(RAG)技术,旨在提升大语言模型(LLM)在搜索、问答、摘要和推理等方面的能力。GraphRA...

霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品|GitHub揽星1k+

Hallo是一种基于分层音频驱动视觉合成模块的开源项目,由复旦大学、百度、苏黎世联邦理工学院和南京大学的研究人员共同完成。该项目的主要贡献是提出了一种分...

远离硅谷、不靠风投!18人团队逆势搞出超人气数据库,CTO 一人5年多写了15万行代码

DuckDB,一个仅诞生5年多的分析型关系数据库,因其每月数百万的下载量和每日超过4TB的扩展下载流量,在数据库市场迅速崛起。该数据库在GitHub和社交媒体上积...

腾讯:终于补齐了Muse系列数字人开源框架,感谢阿里!

腾讯音乐娱乐的Lyra Lab团队开发了一个名为Muse的开源系列项目,致力于虚拟人类的生成。其中的最后一个模块MusePose,已于5月27日正式发布,标志着Muse系列数...
1 2 3 4 5