视频生成
视频,video
从 YC W24 看硅谷 AI 创业新趋势:AI Agent、垂直领域、多模态和 AI 安全
2024年4月4日,Y Combinator(YC)W2024批次Demo Day成功举办,共有260个项目亮相。从2.7万份申请中脱颖而出,通过率低于1%,成为历史上录取比例最低的一轮批...
面壁智能完成数亿元新融资,华为哈勃领投,北京AI产投基金跟投|钛媒体AGI
2024年,面壁智能宣布完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。2024年,面壁智...
全面突围,谷歌昨晚更新了一大波大模型产品
谷歌在 Google’s Cloud Next 2024 大会上发布了一系列 AI 相关的更新和产品,其中包括 Gemini 1.5 Pro、CodeGemma、以及首款自研 Arm 处理器 Axion。Gemini 1...
谷歌最强大模型免费开放了!长音频理解功能独一份,100万上下文敞开用
Gemini 1.5 Pro是谷歌最强大的模型,现在全面对外开放,免费供开发者使用。这个版本增加了音频理解功能,可以解析各种音频内容,无需提供字幕文档。Gemini 1....
离谱!AI超市「无人」收款,1000个印度人藏在背后……
亚马逊的“Just walk out”服务,号称利用AI技术实现无人超市,顾客只需拿走商品,系统会自动识别并发送账单。然而,近期曝光的真相是,背后有一个千人规模的印...
免费AI“神器”第十三弹:会20种语言的克隆数字人突然爆火;美国 AI 机器人能提前0.8秒预测人类表情|钛媒体AGI
Digen AI - 克隆数字人Digen AI推出了一款能够支持20种语言、40+种声音的克隆数字人工具。这款工具利用生成式AI技术,可以同步手势、口型和语调,创造出逼真...
谷歌重磅发布Gemini 1.5 Pro:能自动写影评,理解视频!
随着人工智能技术的不断进步,AIGC(人工智能生成内容)领域正迎来新的发展高潮。谷歌最新发布的Gemini 1.5 Pro模型,标志着大型语言模型(LLM)在多模态理解...
没有数据训练大模型?OpenAI 总裁带队转录YouTube视频,谷歌、Meta 也想尽数据收割套路
2021年底,OpenAI面临数据供应短缺,耗尽了互联网上所有质量稳定的英语文本库。为开发下一代AI系统,他们开发了Whisper语音识别工具,转录YouTube视频中的音...
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了
Andrej Karpathy,前特斯拉Autopilot负责人和OpenAI科学家,近日发布了一个名为「llm.c」的项目,该项目仅使用大约1000行纯C语言代码,就能在CPU/fp32上实现G...
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程
Andrej KarpathyAndrej Karpathy,一位在人工智能领域享有盛誉的大神,近期复出并带来了一项引人注目的项目:使用纯C语言实现GPT的训练,仅用1000行代码就完...