标签:开源
微软开源新版ph4:媲美DeepSeek-R1,参数暴降48倍
微软近期在官网开源了三个新版Phi-4小参数模型,分别是Reasoning、Min-Reasoning和Reasoning-plus。这些模型的最大亮点之一是算力消耗极低,能够在消费级硬件...
让 PostgreSQL 更契合Agent、氛围编程!成立四年、微软投资,这家开源数据库公司终10亿美元卖身Databricks
Databricks 正在与开源数据库引擎开发初创公司 Neon 进行收购谈判,交易金额预计约为 10 亿美元,但可能因员工保留激励方案而超过这一数值。Neon 是一家基于 ...
全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍
DeepSeek-R1模型在H100 GPU上的性能优化取得了显著进展,短短4个月内性能提升了26倍,吞吐量接近DeepSeek官方数据。这一突破得益于SGLang、英伟达等机构的联...
字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%
字节跳动最近开源了一种新的图像编辑方法,名为SuperEdit,该方法在性能上比当前最先进的图像编辑方法提高了9.19%,同时仅使用了1/30的训练数据和1/13的模型...
一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二
基于文本指令的图像编辑任务一直是图像生成和编辑领域的热点,近年来随着Gemini、GPT-4o等商业大模型的推出,这一领域的技术水平不断提升。然而,传统方法通...
机器人界「Sora」来了!清华、星动纪元开源首个AIGC机器人大模型,入选ICML2025 Spotlight
从2023年的Sora到如今的可灵、Vidu、通义万相,AIGC生成式技术在全球范围内迅速普及,推动了AI应用的落地。这一技术不仅在数字世界中展现了强大的生成能力,...
超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光
英伟达最新发布的Llama-Nemotron系列模型在推理性能和内存效率上超越了DeepSeek-R1,并且已经全面开源。这一系列模型包括LN-Nano 8B、LN-Super 49B和LN-Ultra...
陶哲轩:感谢ChatGPT,4小时独立完成了一个开源项目
菲尔兹奖得主陶哲轩在五一假期期间发布了一个开源项目,该项目旨在通过大模型的协助,开发一个用于验证涉及任意正参数的估计是否成立的概念验证软件工具。这...
小米入局大模型赛道!开源MiMo-7B,性能超o1-mini
小米近日宣布进军大模型领域,并开源了一款名为MiMo-7B的模型。尽管MiMo-7B仅有70亿参数,但其在多个测试中表现优异,在数学AIME24/25中分别达到68.2分和55.4...
沉浸式翻译团队新品:BabelDOC PDF,无损翻译 PDF,免费用户可用
沉浸式翻译团队最近开源了其PDF翻译工具——BabelDOC PDF,该工具在很大程度上解决了PDF机翻中常见的排版乱码、串行等问题,能够直接输出对版的精准PDF。BabelD...