图像生成
图像,绘画
教你用豆包P图拯救100张废片,轻松惊艳国庆朋友圈。
假期本应是休息的时间,但作者却因读者需求投入了AI修图教程的创作。豆包P图功能因其便捷性和多样性成为热门工具,从基础的美白磨皮到复杂的跨次元合影,都能...
智谱也来炸场了。
近期AI领域迎来密集的技术更新,多家公司相继发布新一代大语言模型,展现出行业快速迭代的竞争态势。DeepSeek推出V3.2-Exp版本,通过稀疏注意力机制将推理成...
CAIR开源发布超声基座大模型EchoCare“聆音”,10余项医学任务性能登顶
中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)正式开源发布EchoCare“聆音”超声基座大模型,该模型基于超过450万张涵盖50多个人体器官的超声影像...
可能是目前效果最好的开源生图模型,混元生图3.0来了
腾讯混元最新发布并开源了原生多模态生图模型HunyuanImage 3.0,其参数规模高达80B,是目前参数量最大的开源生图模型。该模型将理解与生成一体化融合,成为首...
DeepSeek V3.2 发布:长文本能力新突破,API 价格砍半
DeepSeek正式推出实验性模型DeepSeek-V3.2-Exp,该版本在V3.1-Terminus基础上引入革命性的DeepSeek稀疏注意力(DSA)技术。DSA首次实现细粒度稀疏注意力机制...
激战72小时:我们亲历的全球疯抢中国大模型
WaveSpeedAI团队率先成为全球首个集成并发布阿里巴巴Wan 2.5的第三方API平台,这一事件不仅标志着技术突破,更引发了全球范围内的快速响应与商业落地。上线仅...
香港中科院发布聆音大模型,400万张图喂出个“AI超声神医”
中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)发布的超声大模型“聆音”(EchoCare)标志着医疗AI领域的重大突破。该模型基于全球规模最大的超声...
中国团队重新定义“星际之门”!全球首个太空计算星座已实现常态化商用
卫星在太空中充当算力中枢为地面交通设施服务已成为现实。在一场视觉算法挑战中,参赛团队将道路识别模型部署至在轨卫星,完成从图像采集、模型推理到结构化...
苹果自研一颗关键芯片
苹果正在为具备全局快门功能的手机摄像头铺设基础,该技术能带来更清晰运动画面、更少闪烁条纹和更专业视频效果。全局快门与滚动快门不同,滚动快门逐行读取...
8B硬刚72B!MiniCPM-V 4.5技术报告正式出炉
行业首个具备“高刷”视频理解能力的多模态模型MiniCPM-V 4.5技术报告发布,该模型在多方面表现出色,开源后广受好评。研究背景与创新突破多模态大模型发展面临...