GPT-GPTs
GPT,GPTs,Prompt
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
DeepSeek最近推出了一款新的推理模型DeepSeek-R1-Lite-Preview,这款模型在多个权威评测中超越了包括GPT-4o在内的顶尖模型,甚至在某些方面领先于OpenAI o1-p...
史上最严“中文真实性评估”:OpenAI o1第1豆包第2,其它全部不及格
淘宝天猫集团的研究者们最近提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,旨在评估语言模型回答简短问题的真实性能力。该基准具有中文...
超越 GPT-4o 和 Gemini-1.5,阶跃星辰拿下中国大模型第一
在大模型技术领域,中国公司阶跃星辰的自研万亿参数语言大模型Step-2在国际权威LiveBench榜单中取得了显著成绩,位列国产基座大模型第一,全球第五,逼近Open...
阿里发布Qwen2.5-Turbo,支持100万Tokens上下文!
阿里巴巴推出了Qwen2.5-Turbo版本,该版本将上下文扩展至100万tokens,大幅提升了模型的理解与生成能力。这一扩展使得Qwen2.5-Turbo能够处理10部长篇小说、15...
「全球最严榜单」,阶跃拿下中国TOP 1!杀入世界前五,超过GPT-4o紧跟o1-mini
阶跃星辰自研的万亿参数大模型Step-2在国际权威榜单LiveBench上取得全球第五、中国第一的成绩,成为唯一进入前十的中国语言大模型。该模型在IF Average(指令...
权威榜单登顶国内第一,阶跃星辰Step-2是如何炼成的
国际权威榜单LiveBench官网发布了最新的模型能力榜单,其中阶跃星辰自研的万亿参数语言大模型Step-2位列国产基座大模型第一,全球第五,成绩逼近OpenAI的o1-m...
实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍
自OpenAI发布GPT-4o高级语音模式半年以来,AI实时语音对话已成为大厂展示实力的新战场。尽管语音大模型在训练、部署和交互上存在挑战,但谷歌的Gemini Live和...
被嘲笑只有沙发彩电的理想,怎么在智能化上跑这么快?
理想汽车在外界眼中常被误解为缺乏技术,然而公司不仅在智能座舱领域有所建树,更是全球首家将自研大模型应用于汽车的企业。理想汽车的AI首席科学家陈伟在广...
阿里发布Qwen2.5-Turbo,上下文长度突破100万
阿里巴巴通义大模型团队近日发布了Qwen2.5-Turbo,这是其最新语言模型Qwen2.5的升级版。新模型在多个方面进行了显著提升,尤其是在处理超长上下文的能力上,...
AI Agent大爆发!微软刚刚发布大量商用AI Agent,全民智能体!
在“Microsoft ignite 2024”全球开发者大会上,微软宣布了一系列AI Agent,标志着其推动AI商业化的决心。这些AI Agent基于OpenAI的GPT-4o、o1技术支持,具备易...