标签:AI模型

GPT-4.1 偷摸开测?神秘模型登顶编程榜,社区细扒指向 OpenAI,网友:营销鬼才又来了!

近日,一款名为“Quasar Alpha”的神秘AI模型悄然上线,迅速成为OpenRouter平台上使用率排名第一的编程类AI模型。该模型拥有100万token的上下文窗口,能够处理...

Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了

英伟达于4月8日发布了最新大语言模型Llama3.1 Nemotron Ultra 253B,该模型基于Meta的Llama-3.1-405B-Instruct构建,并通过神经架构搜索(NAS)技术进行了深...

实测完DeepSeek发布的新模型,我觉得AI编程的全民普惠时刻到来了。

DeepSeek最新发布的V3模型在代码生成能力上取得了显著进步,尤其是在前端代码质量和审美方面,已经接近Claude 3.7的水平。尽管在游戏UI和AI模式上仍存在一些...

Cohere 发布多语言 Command A 模型:仅需两张 GPU 即可服务全球企业

加拿大AI初创公司Cohere发布了其最新生成式AI模型Command A,专为企业应用场景设计。该模型由transformer论文作者之一Aidan Gomez与多伦多大学校友Ivan Zhang...

史上最贵 API!比 DeepSeek-R1 贵千倍,OpenAI 高价劝退一批用户!

OpenAI最近推出了o1-pro API,这是其o1“推理”系列模型的更强大版本,旨在提供更优的回答。该模型使用了更多的计算资源,但目前仅对在OpenAI API服务上花费至...

百度周末发布文心4.5和推理模型X1,已经两周年了啊。

百度最新发布的文心4.5和推理模型X1引起了广泛关注。文心4.5是一个原生多模态模型,能够理解音频、视频和图片,但不具备输出能力。相比之下,X1是一个推理模...

刚刚,谷歌用更少参数打败 Qwen 2.5-32B!新模型 Gemma 3 号称“单 GPU 模型王”,团队紧急招兵买马!

谷歌近日发布了Gemma 3,这是一组轻量级的开源AI模型,旨在减少能源消耗和成本,同时提供高性能的推理能力。Gemma 3基于与Gemini 2.0相同的研究和技术构建,...

阿里千问QwQ-32B推理模型开源,比肩671B满血DeepSeek-R1!笔记本就能跑

阿里最新发布的QwQ-32B推理模型,凭借320亿参数的表现,成功追平了当前公认的最强开源模型DeepSeek-R1(6710亿参数),并在多项基准测试中超越了o1-mini模型...

抖音再不接入DeepSeek就晚了

字节跳动旗下的抖音和剪映等产品正在逐步接入AI大模型DeepSeek,尽管这一过程尚未全面展开。剪映的AI视频生成工具即梦正在考虑使用DeepSeek,同时迎来了新的...

千呼万唤始出来的 GPT 4.5,主打的只是一个“大”

OpenAI于2月27日通过直播发布GPT-4.5,标志着其战略定位的重大转变。GPT系列不再作为公司前沿模型的核心,而是逐渐退居为支撑未来推理模型的“技术底座”。此次...
1 2 3 19