标签:AI模型
全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑
面壁智能最新推出的AI模型MiniCPM-o 2.6因其在多模态能力上的卓越表现而受到广泛关注。该模型仅8B的体量,就能在多模态任务中与GPT-4o相媲美,且能在iPad等移...
DeepSeek官方App上线!功能完整且免费,网友:ChatGPT最佳替代品
DeepSeek官方应用已在App Store上线,由DeepSeek V3模型支持,提供深度思考和联网搜索两大核心功能。用户可通过App完成对话、语言翻译、创意写作、编程、解题...
时隔6年,谷歌BERT终于有替代品了!更快更准更长,还不炒作GenAI
新型AI研发实验室Answer.AI和英伟达等近日发布了ModernBERT,这是一个在速度和准确率上显著改进的模型系列,包含基础版139M和较大版395M两个型号。ModernBERT...
微软论文意外「走光」,OpenAI参数全泄密!GPT-4o仅200B,o1 300B
微软和华盛顿大学的研究团队在医学领域的一项研究中意外曝光了OpenAI模型的参数,包括GPT-4、GPT-4o、o1系列模型。其中,GPT-4参数约1.76万亿,GPT-4o参数约2...
大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?
近期,大模型领域出现了两个引人注目的焦点:DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列,包含从0.5B到72B参数的多个版本,覆盖...
全球首个半导体大模型
Aitomatic及其AI联盟合作伙伴推出了SemiKong LLM,这是全球首个专为半导体行业设计的大型语言模型,旨在整合入半导体设计公司的工作流程。该模型基于Meta的Ll...
把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek“国产之光”实至名归?
中国AI初创公司DeepSeek发布了其最新人工智能模型DeepSeek-V3的首个版本,并宣布开源。该模型能够处理多种基于文本的工作负载和任务,包括编码、翻译和撰写论...
是时候停止炒作「o3是AGI」了!背后15人安全对齐团队大盘点
OpenAI最近发布了推理模型o3系列,该模型在ARC-AGI基准上表现出色,成为首个突破该基准的AI模型,引发业界对AGI(人工通用智能)的热烈讨论。o3系列模型的能...
刚刚,OpenAI放出最后大惊喜o3,高计算模式每任务花费数千美元
OpenAI最近发布了新的推理系列模型o3和o3-mini,作为o1系列模型的继任者,这些模型在回答问题前会花费更多时间进行思考以提高准确率。o3系列模型在ARC-AGI基...
OpenAI甩王炸!发布新模型o3,一夜再次改变世界!
OpenAI在技术直播的最后一天发布了预览版模型o3,该模型在多个测试中表现出色。在AIME数学竞赛中,o3得分96.7分,仅错一题,达到了顶级数学家的水平。在ARCAG...