图像生成
图像,绘画
视觉模型智能涌现后, Scaling Law 不会到头
近期,哈佛大学的一篇论文《Scaling Laws for Precision》引发了关于自然语言处理领域Scaling Law可能达到瓶颈的讨论。该论文指出,当前语言模型在大量数据上...
国产模型指令跟随全球第一!来自LeCun亲推的「最难作弊」大模型新榜单
国内初创公司阶跃星辰的万亿参数语言大模型Step-2-16k-202411在LiveBench榜单上取得显著成绩,位列全球第五、国内第一。LiveBench是由图灵奖得主杨立昆联合纽...
宝可梦GO「偷家」李飞飞空间智能?全球最强3D地图诞生,150万亿参数解锁现实边界
宝可梦GO团队宣布构建了一个大规模地理空间模型LGM,标志着空间智能领域的一大进步。LGM通过训练超过5000万个神经网络,参数规模超过150万亿,使计算机能够以...
超越 GPT-4o 和 Gemini-1.5,阶跃星辰拿下中国大模型第一
在大模型技术领域,中国公司阶跃星辰的自研万亿参数语言大模型Step-2在国际权威LiveBench榜单中取得了显著成绩,位列国产基座大模型第一,全球第五,逼近Open...
权威榜单登顶国内第一,阶跃星辰Step-2是如何炼成的
国际权威榜单LiveBench官网发布了最新的模型能力榜单,其中阶跃星辰自研的万亿参数语言大模型Step-2位列国产基座大模型第一,全球第五,成绩逼近OpenAI的o1-m...
实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍
自OpenAI发布GPT-4o高级语音模式半年以来,AI实时语音对话已成为大厂展示实力的新战场。尽管语音大模型在训练、部署和交互上存在挑战,但谷歌的Gemini Live和...
Mistral放大招:124B多模态,Canvas、搜索、图片生成免费用
Mistral AI公司最近推出了两项重大更新,包括Pixtral Large多模态模型和全新Le Chat平台。Pixtral Large是一个拥有1240亿参数的前沿级模型,它在多模态性能上...
2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定
Rokid Glasses是一款集成了AR技术和AI大模型能力的新型AR眼镜,由Rokid与时尚眼镜品牌BOLON合作设计。这款眼镜不仅外形时尚轻便,而且具备多模态AI能力,包括...
NeurIPS 2024高中赛道开卷!人大附中、北师大实验中学等摘得3篇Spotlight
NeurIPS 2024会议首次设立了高中生赛道,旨在鼓励高中生研究机器学习对社会的影响。这一创新举措在4月引发了广泛讨论,有人支持认为这有助于发掘高中生的科研...
发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型
Mistral AI近期推出了其多模态家族的新成员Pixtral Large,这是一个基于124B开放权重构建的超大杯基础模型,具备顶尖的图像理解能力,能够理解文档、图表和自...