大模型

LLM,VLM,模型

苹果开源通用视觉模型:创新训练方法,超1000颗星

苹果公司的研究团队最近发布了一款名为AIMv2的通用多模态视觉模型,该模型具有300M、600M、1.2B和2.7B四种参数规模,并且整体能耗低,使其能够适应手机、PC等...

不受DeepSeek影响,英伟达新财报创记录,收入超1300亿美元

全球AI领导者英伟达(NVIDIA)在官网发布了2025财年的财务业绩报告,其中第四季度收入达到393亿美元,同比增长78%,全年收入更是创纪录地达到1305亿美元,同...

德勤:2025年全球AI芯片规模预计超1500亿美元,2027年增至4000亿美元|钛媒体AGI

德勤中国发布的《技术趋势2025》中文版报告预测,全球芯片市场规模将在2024年达到5760亿美元,其中AI芯片销售额占比11%,超过570亿美元。预计到2025年,新一...

火山引擎 DeepSeek 落地实践分享:企业如何用好推理模型?

DeepSeek R1模型的上线在业界引起了广泛关注,其在火山引擎的快速部署更是成为焦点。为了更好地理解DeepSeek R1模型的实际应用和商业化落地,Founder Park联...

周五畅聊:大家都用 DeepSeek R1 做了啥?

DeepSeek R1自发布以来,开发者们在实际应用中面临了一系列挑战和调整。与以往的非推理模型如GPT-4o、Claude-3.5相比,R1在思考链、响应时间和幻觉问题上需要...

超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!

阿里云旗下的视觉生成基座模型万相2.1(Wan)近日宣布开源,采用宽松的Apache2.0协议,公开了14B和1.3B两个参数规格的全部推理代码和权重。这一开源动作使得...

阿里开源版Sora上线即屠榜,4070就能跑,免费商用

阿里巴巴近期开源了一款名为Wan 2.1的视频生成模型,拥有14B参数量,凭借其卓越的性能在VBench上超越了Sora和Gen-3等竞争对手。该模型在处理复杂运动细节方面...

500万TPM+20msTPOT,火山引擎用「AI云原生」重构大模型部署范式

部署DeepSeek系列模型,尤其是推理模型DeepSeek-R1,已成为AI和云服务商以及企业和组织提供AI服务的重要手段。学校也在部署DeepSeek-R1辅助教育,培养学生正...

用完Claude 3.7,我感觉程序员在加速贬值

Claude 3.7 Sonnet 的发布标志着代码生成领域的一个重大突破,根据测评结果,该模型超越了 DeepSeek R1 和 OpenAI 的 o3 等模型,成为目前全宇宙最好的代码生...

DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口

在AI行业的新赛道“多模态交互”中,声网推出了“对话式AI引擎”,使得所有文本大模型能够迅速获得实时语音对话能力,弥补了大模型在语音交互方面的不足。这一创...
1 2 3 498