标签:性能测试
Cursor终结者?Grok 4正式登顶!马斯克扬言编程碾压,20万N卡年赚47亿美金!
Grok 4的发布标志着xAI在人工智能领域的又一次重大突破。这款通用模型不仅跳过了Grok 3.5,还带来了多个专为特定任务设计的模型,包括编码模型、多模态代理和...
比10年专业医生准4倍!微软发布突破性医疗AI系统
微软最新发布的医疗AI系统MAI-DxO通过模型无关的设计实现了突破性进展,能够适配不同厂商的语言模型并显著提升诊断性能。该系统模拟真实医生的诊断流程,在测...
这个扩散LLM太快了!没有「请稍后」,实测倍速于Gemini 2.5 Flash
Inception Labs推出的Mercury是首款专为聊天应用量身定制的商业级扩散LLM,标志着扩散模型在语言生成领域的重大突破。Mercury的核心优势在于其超快的速度和高...
小红书开源首个大模型,11万亿非合成训练数据
小红书近期开源了其首个大模型dots.llm1,这是一个1420亿参数的专家混合模型(MoE),在推理过程中仅激活140亿参数,显著降低了训练和推理成本。dots.llm1的...
苹果开源通用视觉模型:创新训练方法,超1000颗星
苹果公司的研究团队最近发布了一款名为AIMv2的通用多模态视觉模型,该模型具有300M、600M、1.2B和2.7B四种参数规模,并且整体能耗低,使其能够适应手机、PC等...
Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek
市场反馈显示,该功能与普通AI搜索形成明显差异:普通搜索侧重快速获取表面信息,而Deep Research专攻多层次的深度分析,处理时间从5分钟到半小时不等。用户...
最壕DeepSeek玩家8台Mac跑R1,10万+元凑496GB显存才能跑4bit量化版
DeepSeek-R1是一款正在接受全球网友检验的人工智能模型,它能够通过manim代码快速制作解释勾股定理的动画。为了运行这个模型,有用户投资超过10万元,组建了...
医疗复杂推理开源大模型——华佗GPT-o1
香港中文大学(深圳)和深圳市大数据研究院联合开源了一款专用于医疗领域的复杂大模型——华佗GPT-o1,旨在辅助医生进行更高效的推理。该模型的开发基于高质量...
现在的技术条件,运行100万个并发任务需要多少内存?
在2024年的基准测试中,针对不同编程语言的异步编程内存消耗进行了重新评估。测试程序启动N个并发任务,每个任务等待10秒后程序退出,重点关注协程而非多线程...
Sam Altman泄露新模型o2,太会整活了,营销鬼才!
OpenAI首席执行官Sam Altman发布了一条关于o2模型在GPQA性能测试中达到105%的消息,这一数据远超过人类博士级专家的平均准确率65%和普通人的34%,甚至超过了o...
1
2