“Transformer架构”的搜索结果

马毅首任院长!港大成立计算与数据科学学院,计算机+统计双剑合璧
香港大学新成立的计算与数据科学学院由计算机科学系和统计学系合并而成,旨在革新人工智能和计算机科学的教育。新学院由马毅教授担任首...
上海科大等开源创新模型:文本生成精美3D服装
由上海科技大学、宾夕法尼亚大学、Deemos科技和NeuDim科技的研究人员联合开发的DressCode模型,是一个创新的AIGC(人工智能生成内容)工...
黑匣子被打开了!能玩的Transformer可视化解释工具,本地运行GPT-2、还可实时推理
在2017年,谷歌发表的论文《Attention is all you need》中提出了Transformer架构,对深度学习领域产生了深远影响。该架构不仅在文本和...
对话RWKV作者彭博:单枪匹马挑战Transformer的神秘怪才
彭博,一位16岁考入香港大学物理系的天才少年,经历了对冲基金量化交易和创业制造智能硬件的洗礼后,如今以RWKV模型开发者的身份在AI领...
比OpenAI的Whisper快50%,最新开源语音模型
生成式AI公司aiOla在其官网开源了一款名为Whisper-Medusa的语音模型,该模型在推理效率上相较于OpenAI的Whisper模型提升了50%。Whisper-...
Stable Diffusion原班人马官宣创业,最强开源文生图模型来了
黑森林实验室(Black Forest Lab)由Stable Diffusion原班人马创立,Robin Rombach领衔,宣布成立并推出一系列图像生成模型。公司已经完...
UIUC 李博:如何探索大模型背后的安全隐忧?丨ICML 2024 直击
在AI科技评论的访谈中,ICML Tutorial Chair李博教授分享了她对大模型安全问题的看法,并介绍了她创立的Virtue AI公司。李博教授指出,...
ICML直击丨包揽最佳论文、现场发offer抢人…学术顶会变成了“大厂”顶会
7月27日,ICML(国际机器学习大会)在奥地利维也纳会展中心圆满落幕。作为机器学习领域的顶级会议之一,本届ICML共收到9473篇论文投稿,...
1890美元,就能从头训练一个还不错的12亿参数扩散模型
Sony AI等机构的研究者开发了一种低成本的端到端pipeline,用于训练文本到图像的扩散模型,显著降低了训练成本,同时不需要访问数十亿张...
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
Meta的AI科学家Thomas Scialom在Latent Space播客节目中分享了Llama 3.1的研发思路和Llama 4的更新方向。Llama 3.1的参数规模选择考虑了...
1 2 3 4 14