古早费曼论文手写公式也能转LaTeX,还能看懂梗图,马斯克Grok新功能上线就火了
文章摘要
【关 键 词】 图像理解、数字化、LaTeX转换、品牌识别、科研辅助
xAI公司开发的Grok大模型在最新更新后获得了图像理解能力,这标志着科学文献数字化和标准化工作的重大进展。Grok能够将手写公式转换成LaTeX格式,准确率极高,这一功能受到了科研工作者的广泛关注。此外,Grok还能识别图像中的品牌、点评图片风格和表情,甚至解释笑话。然而,Grok在理解梗图和中文字符方面还有待提高。
Grok的图像理解能力已经得到了实际测试。在公式OCR方面,Grok能够准确将经典论文中的公式截图转换成LaTeX代码。在梗图理解方面,Grok有时能够完全解释笑点,但有时也会解释错误。与ChatGPT相比,Grok在识图能力上还有一定差距,尤其是在中文识别方面。
总的来说,Grok在输出LaTeX表达式和图像主体场景解释方面表现出色,但在梗图解释和中文字符识别方面还有待提升。尽管如此,Grok的图像理解能力已经给科研工作带来了便利,未来还有很大的发展潜力。需要注意的是,Grok目前仅对付费用户开放体验。
原文和模型
【原文链接】 阅读原文 [ 1688字 | 7分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...