音频生成

音频,audio

别只盯着ChatGPT版「Her」,在多模态AI拟人互动上,国内玩家也支棱起来了

第二届多模态情感识别挑战赛(MER24)在AI顶会IJCAI2024上成功举办,旨在推动利用文本、音视频等多模态数据进行AI情感识别的技术发展和真实人机交互场景中的...

终于来了,OpenAI测试GPT-4o高级语音模式!

OpenAI正在对GPT-4o的高级语音模式进行测试,目前仅向部分ChatGPT Plus用户开放。测试的目的是收集关于安全性和功能方面的反馈,以便在8月初发布全面的评估报...

又一新风口!空间计算时代:要么沉浸,要么死亡 | Q 福利

2024年,苹果公司发布了Vision Pro,标志着计算行为轨迹的又一次变革,类似于2007年iPhone的问世。Vision Pro引入了智能化、沉浸式的空间计算平台,使用户能...

反转了?在一场新较量中,号称替代MLP的KAN只赢一局

多层感知器(MLP)作为深度学习模型的基本组成部分,在机器学习领域具有不可替代的地位。然而,MLP存在一些局限性,如难以解释的表示和网络规模的扩展困难。K...

智谱AI视频模型:免费使用,轻松制作6秒搞笑视频

智谱AI近期推出了一款名为“清影”的文生成视频模型,该模型允许用户通过文本或图片输入生成6秒的1440×960高清视频。这款模型对所有用户免费开放,支持PC和手机...

字节大模型同传智能体,一出手就是媲美人类的同声传译水平

近年来,人工智能在自然语言处理领域取得了显著进展,但同声传译(Simultaneous Interpretation, SI)依然是一个挑战。传统的同声传译软件通常采用级联模型,...

这家公司,想把 iPhone 装进一副无线耳机里

在人工智能硬件创新的浪潮中,Iyo公司推出的Iyo One耳机备受瞩目。这款耳机被定位为“音频计算机”,其设计中集成了4nm工艺的CPU、2GB内存、32GB闪存以及电池、...

这才是AI硬件的PMF? 欧洲公司推出AI导盲眼镜,是导盲犬价格 1/10

全球视障人士数量庞大,但导盲犬资源稀缺,每4000万盲人中仅有28000只导盲犬。在中国,1731万视障人士中仅有约400只现役导盲犬,导盲犬培养成本高达20万元人...

给iPhone背面贴个AI录音机,生意老好了

Plaud Note是一款由深圳机智连接科技有限公司开发的AI卡片录音机,专为iPhone设计,能够贴在手机背面。这款产品在Indiegogo众筹平台上取得了巨大成功,销售额...

GPT-4o mini,你好!GPT-3.5 彻底再见!|AI 鲜测

OpenAI 最新推出的 GPT-4o mini 模型以其卓越的性价比和强大的多模态能力,重新定义了 AI 成本效益的标准。在 MMLU 中以 82% 的得分领先市场,成本仅为每百万...
1 5 6 7 8 9 27