图像生成
图像,绘画
一天 15k 星,代码生成碾压 Claude,连 Cursor 都慌了?谷歌 Gemini CLI 杀疯了
谷歌正式发布了Gemini CLI,这是其AI助手在终端环境下的一个版本,标志着三大AI实验室均已推出各自的终端智能体工具。Gemini CLI的亮点在于其非常慷慨的免费...
谷歌AI Agent刚开源!多任务智能体+MCP+谷歌搜索,狂揽9000颗星
谷歌近日在官网开源了AI Agent框架Gemini CLI,这一框架将Gemini大模型直接集成到终端中,为用户提供了强大的功能支持。Gemini CLI的最大亮点之一是其能够直...
这个AI能救命!提前6个月发现胃癌病灶,突破医学影像认知,达摩院做成了
AI技术通过平扫CT识别早期胃癌取得重大突破。浙江省肿瘤医院与阿里巴巴达摩院合作开发的DAMO GRAPE模型,成为全球首个利用非增强CT实现胃癌筛查的AI工具。该...
小米小爱同学:资源受限下,实现端侧大模型的高性能推理
随着大模型能力的持续提升,端侧设备部署成为产业界的重要工程挑战。手机、车载、IoT等设备对模型体积、推理时延、功耗和更新机制提出了极高要求,使得端侧推...
隐藏在Google Labs里的5个神级AI应用。
Google Labs作为Google官方的创新项目集合,致力于通过有趣且实用的方式展示AI技术的多元应用。该项目汇集了三十多个已开放或即将开放的AI产品,涵盖艺术、学...
哈工大发布动画多智能体,文本一键生成连贯动画
随着大规模多模态模型的兴起,AI技术在生成叙事性视频方面的应用成为研究热点。现有的方法,如MINT Video和TTT-Video,虽然在生成单个视频片段时质量有所提升...
多模态AI黑马刷榜后再造神器:一个产品搞定图片视频播客生成,自带百种特效,大牛梅涛团队出品
智象未来推出的vivago2.0是一款集成了多模态AI能力的全能创作工具,由加拿大工程院院士梅涛领衔的团队开发。该工具整合了文生图、图生视频、AI播客、特效模板...
将思维链(CoT)引入具身世界,哪种路径能真正打通机器人「知行合一」?
大模型处理复杂问题时,越来越倾向于生成推理链条,将问题拆解为多个环节逐步解决。支撑这一能力的核心技术是思维链(Chain of Thought, CoT),它从最初的提...
冠军队独享200w?这波是冲大学生来的,超千支队伍已组队报名
生成式AI在广告领域的应用正在迅速崛起,成为大模型变现的重要途径。Meta和谷歌等科技巨头已经通过AI优化广告系统,实现了显著的营收增长。Meta在2024年第四...
中国CIS崛起,索尼带头反击
索尼在2024财年的业绩报告中显示,其CIS(CMOS图像传感器)市场份额与上一年持平,未能实现预期的增长。这一结果主要归因于主要客户销售额不及预期,以及中国...