“多模态”的搜索结果
谷歌开源Gemma Scope,更好解释大模型工作原理
随着多模态大模型的快速发展,其内部神经网络参数数量庞大,导致开发人员难以控制模型输出内容,容易出现“幻觉”现象。为了解决这一问题...
大模型时代的工业质检:技术革新与实践探讨
工业AI质检技术是制造业转型的关键驱动力,对高科技和日常消费品生产至关重要。自20世纪60年代以来,自动化质检在德国、美国和日本等工...
AI助攻人类画家拿下艺术大赛第一名,背后有啥独家秘籍?
两年前,美国科罗拉多州博览会艺术比赛中,一幅名为《太空歌剧院》的AI绘制作品荣获第一名,其气势恢弘、明暗有致,展现出法国象征主义...
“清华系Sora”全球上线,生成一段视频需30秒,每月支付58元|钛媒体AGI
7月30日,北京生数科技有限公司联合清华大学发布了国内首个自研的AI生成视频大模型Vidu,并向全球用户开放使用。Vidu具备文生视频和图生...
对话硅谷公司K-Scale:在车库里对抗烧钱的巨头们,带全人类一起造10亿机器人
K-Scale Labs是一家机器学习初创公司,致力于开发开源机器人AI平台,并推出了世界上首个消费级通用双足人形机器人Stompy。公司的目标是...
黄仁勋与扎克伯格最新实录:Meta的开源哲学是从哪来的?
在2024年SIGGRAPH大会上,NVIDIA创始人兼CEO黄仁勋与Meta创始人兼CEO马克·扎克伯格就人工智能领域的新突破进行了深入的炉边谈话。对话中...
开源模型是中美缩小AI技术差距的关键因素之一?|钛媒体AGI
美国《纽约时报》近日发表文章,指出中国正在加速缩小与美国在人工智能(AI)技术方面的差距,主要原因是中国公司在开源AI模型技术方面...
GPT-4o 最关键功能本周上线,语音交互的时代终于要来了
Voice Agent作为下一代人机交互界面,以其与人类自然沟通方式的一致性,提供了一种直观且低能耗的交互体验。与传统文本交互相比,语音交...
ICML直击丨包揽最佳论文、现场发offer抢人…学术顶会变成了“大厂”顶会
7月27日,ICML(国际机器学习大会)在奥地利维也纳会展中心圆满落幕。作为机器学习领域的顶级会议之一,本届ICML共收到9473篇论文投稿,...
阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进
杨红霞,一位在人工智能领域具有重要影响力的科学家,最近加入了香港理工大学,担任电子计算机系教授。她曾在IBM T.J.沃森研究中心和雅...