标签:性能比较

o1模型医学推理惊人,超过人类医生

哈佛医学院联合多所研究机构通过OpenAI的o1-preview模型,系统评估了大语言模型在医疗推理任务中的实际能力。传统基于选择题的评估方式因无法反映真实临床决...

苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果

苹果公司近日在开源大模型领域取得了重大进展,推出了一款7B参数的模型,其性能与Llama 3 8B相当,且一次性开源了全部训练过程和资源。这一举措受到了业界的...