图像生成
图像,绘画
最强全模态模型Ola-7B横扫图像、视频、音频主流榜单,腾讯混元Research&清华&NTU联手打造
腾讯混元Research、清华大学i-Vision实验室与南洋理工大学S-Lab联合推出的Ola全模态语言模型,通过渐进式模态对齐策略实现了图像、视频和音频理解能力的突破...
CLIP 后门样本检测:揭示网络数据集中的后门风险丨ICLR 2025
多模态模型的安全问题因后门投毒风险引发关注,尤其是CLIP模型在视觉-语言对齐任务中的广泛应用。研究表明,攻击者仅需对0.01%的训练数据投毒即可植入后门,...
「杭州六小龙」首个IPO,群核科技递表港交所,空间智能赛道开启资本化元年
当AI技术从二维向三维空间演进时,智能形态的范式转换正在重塑产业格局。群核科技作为全球空间设计领域的领军企业,近期向港交所提交上市申请,标志着空间智...
AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零
Scale AI、Center for AI Safety与MIT研究者联合推出的ENIGMAEVAL基准,通过1184道源自解谜寻宝竞赛的复杂题目,系统评估大语言模型的多模态推理能力。该基准...
DeepSeek掀低成本革命,中科院系黑马闯入全球TOP 10!破解高精度-低能耗困局
2025年中国大模型领域迎来重要突破,DeepSeek与YAYI-Ultra两大模型展现出显著技术优势。DeepSeek-R1通过算法优化突破算力限制,其深度推理能力为国内大模型行...
接入DeepSeek模型后,AI教育应用App到底应该免费,还是付费商业化?|钛媒体AGI
好未来集团旗下学而思推出的'随时问'APP正式接入DeepSeek-R1 671B大模型,标志着AI教育应用进入新阶段。该应用通过图像识别题目并提供视频讲解,整合超过2.5...
阿里终于意识到开源的价值。
阿里巴巴通义大模型在开发者市场展现出显著影响力,尽管其C端市场占有率低于豆包、Kimi及DeepSeek等ChatBot产品,但开源社区反馈积极。开发者常将通义Qwen与D...
百度决定背叛闭源大模型,李彦宏重新拥抱开源
百度宣布将于2024年6月30日起逐步开源文心大模型4.5系列,标志着其战略从闭源收费向开源开放的转变。这一决策发生在DeepSeek引发行业冲击的背景下,距离百度...
一图一3D世界,视频还可交互,昆仑万维「空间智能」开年首秀来了
2025年被普遍视为智能体爆发元年,但空间智能领域正迎来突破性进展。昆仑万维发布的Matrix-Zero世界模型通过融合3D场景生成与可交互视频技术,将单张静态图像...
李飞飞看中的万亿赛道,中国首个自研空间智能AI登场!单张图即生3D世界
昆仑万维正式发布全自研的Matrix-Zero世界模型,标志着中国在空间智能领域取得突破性进展。该模型包含3D场景生成与可交互视频生成两大核心功能,支持单张图片...