大模型

LLM,VLM,模型

F5 预测:2025年亚太地区企业AI应用的五大趋势

亚太地区企业领导者普遍认为人工智能(AI)已深入融入日常并迅速重塑行业。预计到2025年,亚太地区将成为全球AI创新的领导者。然而,企业在AI转型过程中面临...

当 AI 遇上千亿“低空经济”,智能机器人产业将面临怎样的挑战与机遇?|钛媒体AGI

国家发改委新设低空经济发展司,旨在推动低空经济发展战略和规划,对中国飞行机器人、AI机器人产业提供支持和引导。低空经济、AI和机器人产业规模已达千亿规...

大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?

近期,大模型领域出现了两个引人注目的焦点:DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列,包含从0.5B到72B参数的多个版本,覆盖...

OpenAI科学家盛赞中国大模型:算法非常强,算力用到极致!

OpenAI的高级研究科学家Andrej Karpathy分享了中国开源大模型DeepSeek-v3的显著成就。该模型以其高效的训练效率和低成本而受到关注,仅用280万小时的GPU算力...

谷歌劈柴立军令状:必斩OpenAI,夺回第一!

谷歌CEO劈柴在年度战略会议上强调,2025年将是AI领域的关键一年,谷歌必须加快步伐以应对颠覆性时刻的挑战。谷歌与微软OpenAI的竞争日益激烈,谷歌在追赶Chat...

DeepSeek V3“报错家门”:我是ChatGPT

近期,DeepSeek V3成为大模型圈的热门话题,但其存在一个bug,即在缺少问号的情况下,DeepSeek V3会错误地自称为ChatGPT。尽管有人怀疑DeepSeek V3可能基于Ch...

AISuite:一个新的开源 Python 库,提供了统一的跨 LLM API

吴恩达最近推出了`aisuite`,这是一个旨在为流行的大型语言模型(LLM)提供统一API的平台,类似于OpenAI的API。这个工具的目的是简化在同一个应用程序中使用...

算力直降97%,GPT-3存储只用20MB?!这篇直接在1.58-bit下训练模型的新论文火了

最近,一项名为“noise_step”的新技术由Will小哥提出,该技术允许模型在1.58-bit低精度下直接训练,无需反向传播或动量加速,从而大幅降低算力和存储消耗。这...

全球首个半导体大模型

Aitomatic及其AI联盟合作伙伴推出了SemiKong LLM,这是全球首个专为半导体行业设计的大型语言模型,旨在整合入半导体设计公司的工作流程。该模型基于Meta的Ll...

雷军千万年薪挖角95后天才少女,AI女神逆风翻盘!

中国大模型DeepSeek-V3的成功引起了业界的广泛关注,特别是其核心研究员罗福莉,一位95后AI领域的天才少女。罗福莉的成长历程充满励志色彩,从对计算机一无所...
1 238 239 240 241 242 317