“语音识别”的搜索结果

2024年，苹果公司发布了Vision Pro，标志着计算行为轨迹的又一次变革，类似于2007年iPhone的问世。Vision Pro引入了智能化、沉浸式的空...

AIGC动态

3个月前

OpenAI的GPT-4o模型虽然在5月14日的发布会上展示了出色的实时音视频对话能力，但至今仍未公开发布。推迟的原因包括法律纠纷、安全问题以...

AIGC动态

3个月前

近年来，人工智能在自然语言处理领域取得了显著进展，但同声传译（Simultaneous Interpretation, SI）依然是一个挑战。传统的同声传译软...

AI-Agent

3个月前

科大讯飞于6月27日在北京发布了讯飞星火大模型V4.0及其相关应用。该模型在七大核心能力上进行了全面提升，与GPT-4 Turbo全面对标，并在8...

AIGC动态

4个月前

原计划在6月底推出的GPT-4o语音模式将推迟一个月，以便进一步完善产品。预计今年秋天，所有ChatGPT Plus用户将能够使用这一功能。GPT-4o...

AIGC动态

4个月前

全球人工智能领导者英伟达（Nvidia）于6月15日在其官网开源了一款名为Nemotron-4 340B的大模型，专为生成合成数据而设计。该模型能够快...

AIGC动态

4个月前

研究人员开发了一款人工智能工具，能够区分狗叫声的不同含义，并识别狗的年龄、性别和品种。该工具基于语音识别模型Wav2Vec2，通过收集7...

AIGC动态

4个月前

近期研究表明，通过训练纯解码器生成模型，可以成功地生成包括音频、图像和状态-动作序列在内的多种模态的新序列。这些模型通常采用词汇...

AIGC动态

5个月前

AI语音助手的机遇： - AI语音助手通过重新定义电话，为企业节省成本，降低风险，为消费者提供低成本服务。 - 成功的语音助手需要关...

AI-Agent

5个月前

中国电信人工智能研究院发布了一款能够识别和理解多达30种方言的语音大模型——“星辰语音大模型”。这一模型的核心功能主要体现在语音识别...

AIGC动态

5个月前