音频生成

音频,audio

奥特曼深夜发动价格战,GPT-4o mini暴跌99%!清华同济校友立功,GPT-3.5退役

OpenAI最近推出了GPT-4o mini,这是一款更小、性能更强、成本更低的人工智能模型。相较于GPT-3.5,GPT-4o mini在性能上有所提升,同时价格降低了60%以上。这...

GPT-4o 现货变期货,是什么在拖 OpenAI 的后腿

RTC技术在实时AI普及中扮演着关键角色。OpenAI的GPT-4o模型通过提高效率和加入情感分析,将AI语音互动的平均时延缩短至320毫秒,与人类日常对话响应速度几乎...

大厂掀起视频生成「军备竞赛」,AI 真能干掉好莱坞?

2024年7月5日,在上海世博展览馆H3馆X会议室,由世界人工智能大会组委会办公室主办,机器之心、东浩兰生共同承办的「2024 WAIC 视频生成前沿技术论坛」成功举...

美国提出《COPIED法案》,针对ChatGPT、Udio、Suno等产品

美国参议院官网于7月12日公布了一项新的法案——COPIED Act,由Cantwell、Blackburn和Heinrich三位两党国会议员提出。该法案旨在通过制定规则来标记、验证和检...

AI 视频不只是视频生成!英伟达领投 5000 万,专注视频理解的这家公司值得关注

视频生成领域的竞争日益激烈,许多公司如Pika、Sora、Luma AI和国内的可灵等都在探索多模态视频生成技术。尽管视频生成技术备受关注,但其实际应用场景落地相...

Hebbia获1.3亿美元融资,用AI Agent简化工作流程

Hebbia,一家专注于AIGC领域的AI初创公司,于7月9日在其官网宣布成功获得1.3亿美元的B轮融资。本轮融资由a16z领投,Index Ventures、谷歌风险投资和Peter Thi...

深度!超详细文本提示词技巧,Gen-3发布保姆级教程

生成式AI平台Runway于7月9日在其官网发布了针对其最新文生视频模型Gen-3 Alpha的文本提示教程。该教程旨在帮助用户更精准地生成视频,解决用户在使用Gen-3等...

WAIC上,高通这一波生成式AI创新,让我们看到了未来

生成式人工智能(AI)技术的快速发展正在推动产业格局的快速变革。微软公司推出的AI PC,搭载新型芯片,具备超过40万亿次操作每秒的AI算力和全天电池续航能力...

8 人团队的开源多模态:Moshi,效果堪比 GPT-4o,合成数据立功

法国非营利性AI研究机构Kyutai开发了一个名为Moshi的实时语音多模态模型,该模型具备听、说、看的能力,能够理解带有法国口音的英语。Moshi可以流畅地进行日...

成立半年就敢踢馆 OpenAI ,首个开源模型不输 GPT-4o,LeCun 、PyTorch 之父齐声叫好!

Kyutai,一个由8人组成的非营利性AI研究实验室,在短短6个月内开发出了一种名为'Moshi'的实时原生多模态基础AI模型。Moshi能够表达70多种情绪,以不同风格说...
1 19 20 21 22 23 40