图像生成
图像,绘画
深扒151份JD,揭秘“数据标注员”:两极分化,30倍薪水差,残酷的未来
数据标注作为人工智能发展背后的人类底座,其行业生态与岗位要求正经历深刻变革。当前数据标注岗位的月薪存在巨大差异,首尾相差可达三十多倍,这种收入鸿沟...
帮大家总结了一下凌晨的苹果WWDC26。
苹果WWDC 2026发布会以平稳的姿态落幕,这也是蒂姆·库克作为首席执行官最后一次主持该活动,整场发布会的核心主题全面聚焦于人工智能技术的深度整合与应用。...
一张卡,10分钟,这家公司把地球玩成了《我的世界》!
高德近期发布了全球首个3D原生城市世界模型ABot-Earth0.5,标志着城市级场景3D原生技术取得重要突破,并彻底重塑了传统3D建模的生产逻辑与成本结构。该模型仅...
作为一个招蚊体质,这是我第一个真心支持的AI项目
入夏后蚊子给人类带来极大困扰,一位计算机视觉和机器人方向的工程师Steven Cheng在社交媒体上展示了一套自制的高科技AI激光灭蚊系统,引发了广泛关注和热烈...
CVPR 开幕式:全场泪目缅怀孙剑,广工本科生靠「古董显卡」逆袭 | CVPR 2026
CVPR 2026正会在美国丹佛市开幕,标志着计算机视觉领域从屏幕识别全面迈向具备物理法则的真实三维世界。开幕式公布的数据展现了该领域的活跃程度。本届大会吸...
CVPR开幕式:全场泪目缅怀孙剑,广工本科生靠「古董显卡」逆袭丨CVPR 2026
CVPR 2026正会在美国科罗拉多州丹佛市正式开幕,标志着计算机视觉领域正全面向具身智能与真实三维物理世界迈进。大会开幕式公布了一系列创纪录的数据,显示出...
对话速腾聚创杨先声:机器人的通用智能,先从一双「不骗人」的眼睛开始 | ICRA 2026
当前全球具身智能行业在落地过程中面临着机器人视觉感知能力不足的痛点,传统传感器难以精准感知三维世界,导致机器人操作速度慢且无法进行精细操作。为解决...
字节开源王炸Bernini!轻松拿捏各类视频编辑任务
Bernini团队发布并开源了一款将多模态大模型与扩散模型深度融合的统一视频生成与编辑框架。该框架通过物理分工理念,让多模态大模型担任语义规划师,基于DiT...
李飞飞万字长文刷屏:网红文生视频只是“画皮”,真正的万亿级风口在这|附中英全文
李飞飞及其团队针对当前人工智能领域被过度使用的“世界模型”概念进行了深度剖析,指出物理世界的运行基底与语言模型截然不同。真正的世界模型必须学习空间和...
英伟达全模态Cosmos 3:一个模型搞定物理智能看、想、做、演
英伟达最新发布了面向物理智能的全模态世界模型Cosmos 3,该模型采用统一的混合Transformer架构,能够同时处理和生成语言、图像、视频、音频与动作序列五种模...



