标签:开源
DeepSeek V3“小版本更新”背后,V3和R1正在融合成一个模型
DeepSeek在3月24日发布了V3的小版本迭代“DeepSeek-V3-0324”,并在3月25日晚发布了官方报告。此次更新主要聚焦于推理能力、前端开发能力、中文写作能力和中文...
无需Attention的未来,RWKV-7能成为替代Transformer的那只黑天鹅吗?
尽管Transformer在自然语言处理和其他领域广泛应用,但其在处理长序列时存在显著局限性。对于百万级别的上下文窗口,Transformer的性能会显著下降,限制了其...
拾象科技万字详解MCP:Agentic AI中间层最优解,以及创业公司的三个机会
Anthropic推出的Model Context Protocol(MCP)在AI领域引发了广泛关注,尤其是在Agentic AI的中间层领域,MCP已经显著垄断了AI应用与工具之间的连接层。MCP...
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
阿里通义千问Qwen发布了最新视觉语言模型Qwen2.5-VL-32B-Instruct,进一步扩展了其开源家族的产品线。该模型在尺寸和性能之间取得了平衡,能够在本地运行,并...
DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了
DeepSeek V3-0324的发布虽然被官方称为“小版本升级”,但实际表现却远超预期。该版本在多个测试中展现出显著的能力提升,尤其是在复杂问题的处理上。例如,在4...
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
DeepSeek-V3-0324的发布标志着AI领域的一次重要升级。该模型拥有6850亿参数,虽然参数增幅不大,但在代码和数学推理能力上取得了显著提升。特别是在代码领域...
DeepSeek 发布 V3 模型更新:除了编程能力大幅提升,还有更宽松的开源协议
DeepSeek V3 模型的最新更新在编程能力上取得了显著提升,尤其是在前端编码方面。此次更新虽然是小版本升级,但已经在其官方网页、App 小程序等入口开放。新...
Browser Use融资1700万美元,Manus爆火背后的秘密武器
Browser Use是一家专注于AI智能体技术的创业公司,其工具能够帮助智能体更轻松地「读懂」网站,从而自动化处理各种任务。该公司最近完成了1700万美元的种子轮...
突发!DeepSeek开源新版V3,再次震惊国外
国内著名大模型平台DeepSeek近日开源了其V3模型的最新版本V3-0324,尽管发布过程极为低调,未在国内外社交媒体上进行宣传,但该模型迅速引起了广泛关注。V3-0...
实测完DeepSeek发布的新模型,我觉得AI编程的全民普惠时刻到来了。
DeepSeek最新发布的V3模型在代码生成能力上取得了显著进步,尤其是在前端代码质量和审美方面,已经接近Claude 3.7的水平。尽管在游戏UI和AI模式上仍存在一些...