标签:多语言
阿里开源多语言大模型,支持全球90%人口
阿里巴巴开源的多语言大模型Babel,旨在解决资源匮乏语言在人工智能领域中的不足。该模型支持25种主流语言,覆盖全球90%以上的人口,包括豪萨语、波斯语、印...
Cohere 发布多语言 Command A 模型:仅需两张 GPU 即可服务全球企业
加拿大AI初创公司Cohere发布了其最新生成式AI模型Command A,专为企业应用场景设计。该模型由transformer论文作者之一Aidan Gomez与多伦多大学校友Ivan Zhang...
语音模型平台Cartesia获6400万美元,只需3秒克隆语音
语音模型平台Cartesia宣布获得6400万美元A轮融资,由Kleiner Perkins领投。同时,Cartesia推出了最新语音模型Sonic 2.0和Sonic Turbo,其中Sonic 2.0的语音克...
Mistral AI 发布号称最强 OCR API:能解锁 90% 非结构化数据,1 美元搞定 2000 页文档
法国 AI 明星创企 Mistral AI 发布了一款名为 Mistral OCR 的光学字符识别(OCR)API,旨在帮助企业更高效地处理和理解各种文档。该 API 能够从非结构化的 PD...
千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷
法国大模型独角兽 Mistral AI 近期推出了其光学字符识别(OCR)产品 Mistral OCR,号称是“世界上最好的 OCR 模型”。该模型以图像和 PDF 作为输入,能够以前所...
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
MiniMax公司推出的海螺语音AI工具以其卓越的语音生成能力在市场中占据领先地位。该工具基于升级的T2A-01系列语音大模型,能够快速稳定地生成语音,具备音质清...
斯坦福AI科研神器开源,一键成文GPT-4o mini加持!科研写作彻底解放双手
斯坦福大学的研究团队最近推出了STORM和Co-STORM系统,这两个系统能够整合可靠信息并生成高质量的长篇文章。STORM系统通过多角度问答迭代式生成文章,而Co-ST...
大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?
近期,大模型领域出现了两个引人注目的焦点:DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列,包含从0.5B到72B参数的多个版本,覆盖...
讯飞版《Her》长脸了!多模态虚拟人表情动作超逼真,一张图一句话就能DIY自己
科大讯飞近期推出了讯飞星火4.0 Turbo,标志着其大模型的又一次重大升级。这一版本在数学、代码和特定领域长文本能力等七大核心能力上全面超越了GPT-4 Turbo...
史上首个AI+人类大合唱,ChatGPT语音模式玩出新高度!
OpenAI为ChatGPT Plus和Team用户推出了高级语音模式,允许用户与AI进行更丰富的互动。标普全球AI副总监AJ Smith展示了与ChatGPT合唱《Eleanor Rigby》的过程...
1
2