标签:文本生成
OpenAI深夜发布3个全新的语音模型,一手实测都在这了。
OpenAI近期发布了一系列新的语音和文本处理模型,包括两个语音转文本(STT)模型和一个文本生成语音(TTS)模型。这些模型通过API提供接入方式,旨在提升语音...
逐字生成非最优?试试逐「块」生成!Block Diffusion打通了自回归与扩散
扩散模型在生成图像和视频方面取得了显著进展,并在处理离散数据(如文本或生物序列)方面展现出潜力。与自回归模型相比,扩散模型具有加速生成和提高输出可...
世界最好小参数开源大模型!超谷歌、Meta,手机、平板轻松运行
法国大模型平台Mistral.AI推出了专为移动设备设计的Ministraux模型,包含3B和8B两个版本。这些模型在文本生成、推理、函数调用和效率方面表现出色,性能超越...
刚刚,OpenAI开放ChatGPT Windows版本,可像Office那样使用了
OpenAI最近宣布,为所有ChatGPT Plus、Enterprise、Team和Edu用户提供Windows桌面应用的早期版本。用户可以在微软应用商店下载该应用,并通过Alt + Space快捷...
超越Sora!全球首个带背景音乐,文生1080超高清视频模型
Meta公司推出了一款名为Movie Gen的大模型,标志着其正式进入文本生成视频(AIGC)领域。该模型拥有300亿参数,能够以每秒16帧的速度生成16秒长的1080P超高清...
MiniMax,也许做出了最接近 Sora 的文生视频产品
MiniMax公司近期推出了一款名为abab-video-1的视频模型,并通过其产品“海螺AI”向用户展示了文生视频功能。尽管较晚进入市场,MiniMax的产品在技术上实现了显...
非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1
阿布扎比技术创新研究所(TII)发布了一款名为Falcon Mamba 7B的新型开源Mamba架构模型,该模型自2023年12月首次推出以来,已成为Transformer模型的有力竞争...
上海科大等开源创新模型:文本生成精美3D服装
由上海科技大学、宾夕法尼亚大学、Deemos科技和NeuDim科技的研究人员联合开发的DressCode模型,是一个创新的AIGC(人工智能生成内容)工具,能够根据文本描述...
苹果 AI 官方 prompt 泄露,看起来挺简单的
iOS 18测试版发布后,部分用户提前体验了苹果在WWDC宣布的Apple Intelligence功能。然而,在体验之前,苹果为AI功能编写的prompt指令文件被泄露。Reddit用户...
RAG微调Llama 3竟超越GPT-4!英伟达GaTech华人学者提出RankRAG框架
佐治亚理工学院和英伟达的学者们提出了一种名为RankRAG的微调框架,旨在简化传统的RAG(Retrieval-Augmented Generation)流水线。RAG是一种在文本生成任务中...
1
2