图像生成
图像,绘画
超过GPT-image-1!大黑马Black Forest刚开源新模型,只用文本实现一键PS
知名开源平台Black Forest近期发布了文生图模型FLUX.1-Kontext的开发者版本,该版本专注于图像编辑任务,支持迭代编辑,并能够在各种场景中保留角色特征。FLU...
5款大模型考「山东卷」,Gemini、豆包分别获文理第一名
近期,5款主流大模型参与了2025年山东高考全科闭卷测评,结果显示AI的应试能力已实现质的飞跃。字节跳动Seed团队组织的测评采用750分制,未进行任何提示工程...
ICCV 2025放榜!录取率24%,夏威夷门票你抢到了吗?
ICCV 2025将于10月19日至25日在美国夏威夷举行,会议主办方已向投稿者发送了论文接收结果的通知。数据显示,今年大会共收到11239份有效投稿,最终录用2699篇...
一天 15k 星,代码生成碾压 Claude,连 Cursor 都慌了?谷歌 Gemini CLI 杀疯了
谷歌正式发布了Gemini CLI,这是其AI助手在终端环境下的一个版本,标志着三大AI实验室均已推出各自的终端智能体工具。Gemini CLI的亮点在于其非常慷慨的免费...
谷歌AI Agent刚开源!多任务智能体+MCP+谷歌搜索,狂揽9000颗星
谷歌近日在官网开源了AI Agent框架Gemini CLI,这一框架将Gemini大模型直接集成到终端中,为用户提供了强大的功能支持。Gemini CLI的最大亮点之一是其能够直...
这个AI能救命!提前6个月发现胃癌病灶,突破医学影像认知,达摩院做成了
AI技术通过平扫CT识别早期胃癌取得重大突破。浙江省肿瘤医院与阿里巴巴达摩院合作开发的DAMO GRAPE模型,成为全球首个利用非增强CT实现胃癌筛查的AI工具。该...
小米小爱同学:资源受限下,实现端侧大模型的高性能推理
随着大模型能力的持续提升,端侧设备部署成为产业界的重要工程挑战。手机、车载、IoT等设备对模型体积、推理时延、功耗和更新机制提出了极高要求,使得端侧推...
隐藏在Google Labs里的5个神级AI应用。
Google Labs作为Google官方的创新项目集合,致力于通过有趣且实用的方式展示AI技术的多元应用。该项目汇集了三十多个已开放或即将开放的AI产品,涵盖艺术、学...
哈工大发布动画多智能体,文本一键生成连贯动画
随着大规模多模态模型的兴起,AI技术在生成叙事性视频方面的应用成为研究热点。现有的方法,如MINT Video和TTT-Video,虽然在生成单个视频片段时质量有所提升...
多模态AI黑马刷榜后再造神器:一个产品搞定图片视频播客生成,自带百种特效,大牛梅涛团队出品
智象未来推出的vivago2.0是一款集成了多模态AI能力的全能创作工具,由加拿大工程院院士梅涛领衔的团队开发。该工具整合了文生图、图生视频、AI播客、特效模板...