Claude 3终于来了，最强大模型易主？不，网友亲测了才算数！

AIGC动态2年前 (2024)发布 ai-front

2,553 0 0

模型信息

【模型公司】 百川智能
【模型名称】 Baichuan2-53B
【摘要评分】 ★★★★★

文章摘要

文章主要介绍了Anthropic公司发布的新一代AI大模型系列——Claude 3。这个系列包括三个模型，分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus，它们在能力上由弱到强排列。Anthropic表示，Claude 3 Haiku是最快的模型，适用于需要即时响应的场景；Claude 3 Sonnet在智能和速度之间提供平衡，适合企业工作负载；而Claude 3 Opus则是能力最强的模型，实现了接近人类的理解能力，适用于高度复杂的任务。

在多项基准测试中，Claude 3 Opus得分超过了GPT-4和Gemini 1.0 Ultra，树立了新的行业基准。此外，Claude 3系列模型在长文本处理、图像和文件输入等方面也有所提升。价格方面，Opus、Sonnet和Haiku的输入和输出费用分别为15美元/百万tokens、3美元/百万tokens和0.25美元/百万tokens。

Anthropic还发布了一份42页的技术报告，详细介绍了Claude 3系列模型的训练数据、评估标准以及更详细的实验结果。尽管Anthropic声称自家模型比GPT-4更强，但网友们对基准测试并不抱太大希望，因为基准测试可能存在偏见。

一些网友通过自己的方法进行了测试，发现Claude 3在某些方面确实表现出色，但在其他方面仍有改进空间。例如，在ASCII码处理、3D自画像渲染和代码能力等方面，Claude 3表现出了较高的水平，但在将网站UI界面转为代码的任务中，Claude 3未能成功，而ChatGPT则成功执行了任务。

总的来说，Claude 3系列模型在某些方面取得了显著的进步，但仍需进一步改进以满足不同场景的需求。