大模型

LLM,VLM,模型

超九成年轻人工作学习离不开AI,人均还有1.8个AI朋友丨Soul《2025 Z世代AI使用报告》

年轻一代与AI的共生关系在Soul App旗下Just So Soul研究院发布的《2025 Z世代AI使用报告》中得到详细展现。调研显示,超九成年轻人已习惯在工作学习中使用AI...

LLM「想太多」有救了!高效推理让大模型思考过程更精简

大语言模型(LLM)在复杂推理任务中表现出色,但常常出现「过度思考」的现象,导致推理过程冗长且效率低下。这种「过度思考」不仅增加了计算资源的消耗,还影...

Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek

Meta在周末发布了其最新AI模型系列Llama 4,包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这些模型经过大量未标注的文本、图像和视频数据训练,...

刚刚,Meta发布Llama 4系列模型

Meta今日发布了Llama 4系列模型,标志着其在人工智能领域的又一重要进展。Llama 4系列是首批开放权重的原生多模态模型,支持超长上下文,并首次采用了混合专...

LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯

在训练细节方面,Meta采用了全新的训练技术MetaP,通过设置关键模型超参数,实现了在不同批量大小、模型宽度和深度之间的良好扩展和泛化。Llama 4系列在200种...

从0到1玩转MCP:AI的「万能插头」,代码手把手教你!

在人工智能快速发展的背景下,大型语言模型(LLM)的能力虽然令人惊叹,但其局限性也逐渐显现,尤其是它们无法直接访问实时信息或外部工具。为了解决这一问题...

Meta推出Llama 4:MoE构架、原生多模态、10M上下文,没有发布推理模型

Meta 创始人兼首席执行官马克·扎克伯格宣布推出全新 Llama 4 系列模型,包括两款即时可用的模型——Llama 4 Maverick 和 Llama 4 Scout,以及一款仍在训练中的...

10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型

多模态大语言模型在实际应用中展现出卓越性能,但其计算开销和显存占用问题仍然是关键瓶颈。KV cache机制通过显存换取计算效率,但随着输入数据规模的增大,...

奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了

OpenAI首席执行官奥特曼近日宣布了多项关于GPT-5的重磅消息,包括其免费开放计划以及整合多项尖端技术的策略。尽管GPT-5的发布将推迟几个月,但奥特曼强调,...

一张照片秒生好莱坞级运镜!子弹时间/推拉环绕,AI视频注入电影级灵魂

Higgsfield AI最新推出的Motion Controls AI视频生成技术,标志着AI在电影级动作捕捉和视频生成领域取得了显著进展。该技术能够通过一张静态图像生成具有真实...
1 42 43 44 45 46 590