大模型
LLM,VLM,模型
刚刚!奥尔特曼终极手工“小作文”称未来10年AI将变革一切,不点名骂马斯克“如此卑鄙”
OpenAI近期发布了其最强推理型AI模型o3-pro,并将价格大幅下调80%,使其与GPT-4o持平。这一举措显著降低了高性能AI的使用门槛,可能加速AI技术的普及。与此同...
OpenAI深夜突发o3-Pro,价格暴降80%,史上最强模型来了
OpenAI于今日凌晨宣布向ChatGPT和API中的所有Pro用户提供其最新、最强大的模型o3-Pro。该模型具备多项先进功能,包括自动调用多种工具进行网页搜索、文件分析...
AI 创业者的反思:那些被忽略的「快」与「长」
周喆吾在分享其创业经验时,强调了AI创业中两个关键因素:速度和长文本上下文处理能力。他指出,快是用户体验的核心,尤其是在AI产品中,用户习惯会被便捷性...
大模型热度退潮,真正的技术创新者开始被「看见」
近年来,大模型领域的竞争格局发生了显著变化,从盲目追逐规模转向更注重技术本质的创新。过去两年中国的大模型投资更多聚焦商业模式,而硅谷则倾向于押注技...
WaveSpeedAI 成泽毅:AI Infra 本来就是一门能挣钱的生意
成泽毅的职业轨迹始于阿里,凭借出色的技术能力迅速晋升为部门骨干,但很快感受到大厂的天花板限制。追求更大发挥空间的他,先后加入两家推理加速初创公司,...
TypeScript“杀疯了”!60% 到 70%YC 创企用它构建 AI Agent,超越 Python 有戏了?
Mastra AI创始人Sam Bhagwat近期透露,约60~70%的YC X25 Agent公司选择TypeScript构建AI Agent,这一现象引发行业广泛讨论。早期AI框架如LangChain以Python为...
苹果憋一年终超同参数 Qwen 2.5?三行代码即可接入 Apple Intelligence,自曝如何做推理
苹果在WWDC全球开发者大会上推出了新一代专为增强Apple Intelligence功能开发的基座语言模型。该模型家族包括一个约3B参数的紧凑型设备端模型和一个基于服务...
华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断
华为昇腾万卡算力集群实现了近乎'永不罢工'的稳定性能,其核心突破在于构建了三大智能保险系统。该系统通过全栈可观测能力实时监控集群运行状态,故障诊断组...
大模型是「躲在洞穴里」观察世界? 强化学习大佬「吹哨」提醒LLM致命缺点
加州大学伯克利分校副教授Sergey Levine近期提出一个核心疑问:为何语言模型通过预测下一个token能获得强大认知能力,而视频模型通过下一帧预测却收效甚微。...
让AI自己设计芯片!中国科学院发布「启蒙」,芯片全流程自动设计
中国科学院计算技术研究所与软件研究所联合推出的「启蒙」系统,标志着处理器芯片软硬件设计领域的一次重大突破。该系统基于AI技术,实现了从芯片设计到基础...