图像生成
图像,绘画
强化学习也能预训练?效果可提升20倍,华人新作引爆RL新范式!
大规模预训练和微调的模式在机器学习领域取得了显著成功,但在强化学习(RL)中的应用仍面临挑战。强化学习需要对时间和意图进行推理,传统方法在处理长时间...
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
阿里最新发布的多模态模型Qwen-VLo在图像生成和编辑领域展现了强大的能力,引发了广泛关注。该模型在原有的多模态理解和生成能力基础上进行了全面升级,具备...
香港科技大学、Manycor开源空间大模型,超3000颗星
香港科技大学与Manycore联合开源了一种名为SpatialLM的空间大模型,专注于处理3D点云数据并生成结构化的三维场景理解输出。这一模型的目标是让机器能够像人类...
豆包大模型“考上”清北的背后
豆包大模型1.6(Seed 1.6-Thinking)在2025年高考中取得了文科683分、理科648分的成绩,位列全球顶级通用大语言模型的前列,具备冲击清华和北大的实力。这一...
2G 内存跑 Gemma 3n 完整版!全球首个 10B 内模型杀疯 LMArena:1300 分碾压记录
谷歌正式发布了Gemma 3n完整版,这是一款面向开发者的开源大模型,具备输入图像、音频和视频的能力,并支持文本输出。Gemma 3n的设计亮点在于其天生多模态和...
OpenAI员工爆料:已抢先体验GPT-5!7月上线,疑似完全多模态
关于GPT-5的讨论近期在科技界引发广泛关注,多个线索表明OpenAI可能已开始内部测试这一新一代模型。Sam Altman在X平台关注神秘人物Yacine的举动,结合OpenAI...
90%展位已售罄!边缘AI软硬件方案创新汇聚!
边缘AI技术自去年以来进入爆发式增长阶段,预计到2025年,全球边缘AI市场价值将达到250亿美元,硬件设备总量突破20亿台,芯片市场规模达730亿美元。2025年至2...
超过GPT-image-1!大黑马Black Forest刚开源新模型,只用文本实现一键PS
知名开源平台Black Forest近期发布了文生图模型FLUX.1-Kontext的开发者版本,该版本专注于图像编辑任务,支持迭代编辑,并能够在各种场景中保留角色特征。FLU...
5款大模型考「山东卷」,Gemini、豆包分别获文理第一名
近期,5款主流大模型参与了2025年山东高考全科闭卷测评,结果显示AI的应试能力已实现质的飞跃。字节跳动Seed团队组织的测评采用750分制,未进行任何提示工程...
ICCV 2025放榜!录取率24%,夏威夷门票你抢到了吗?
ICCV 2025将于10月19日至25日在美国夏威夷举行,会议主办方已向投稿者发送了论文接收结果的通知。数据显示,今年大会共收到11239份有效投稿,最终录用2699篇...