性能优化 | 第 5 页

新PyTorch API：几行代码实现不同注意力变体，兼具FlashAttention性能和PyTorch灵活性

机器之心报道了PyTorch团队为解决注意力机制实现中的超立方体问题而引入的FlexAttention。注意力机制在机器学习中至关重要，但现有的实现如FlashAttention虽...

AIGC动态

1年前 (2024)

阿里开源新语音模型，比OpenAI的Whisper更好！

阿里巴巴公司在Qwen-Audio的基础上推出了新一代的开源语音模型Qwen2-Audio，该模型在多个方面进行了显著的优化和改进。Qwen2-Audio模型包含基础版和指令微调...

AIGC动态

1年前 (2024)

思特威正式发布子品牌飞凌微，首发产品定位智驾视觉处理

思特威（SmartSens，股票代码688213）近日宣布成立全资子公司飞凌微电子（Flyingchip™），并发布了飞凌微M1车载视觉处理芯片系列。该系列包括M1（Camera ISP...

AIGC动态

1年前 (2024)

两天内，Meta 和 Mistral 两款主流大模型打擂台！已经不仅卷性能了，谁更便宜就用谁？

法国AI初创公司Mistral发布了其旗舰级开源模型Mistral Large 2，拥有1230亿个参数，与Meta和OpenAI的最新模型在代码生成、数学和推理方面表现相当。Mistral L...

AIGC动态

1年前 (2024)

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer

斯坦福大学、加州大学圣地亚哥分校、加州大学伯克利分校和Meta的研究人员提出了一种名为测试时间训练层（Test-Time-Training layers，TTT）的全新架构，旨在...

AIGC动态

1年前 (2024)

Mamba-2新架构出世一统江湖！普林斯顿CMU华人再出神作，性能狂飙8倍

Mamba-2架构在AI界再次引发关注，其在统一状态空间模型（SSM）和注意力机制（Attention）的基础上，成功将Transformer模型与SSM结合，形成了一种新的高效序列...

AIGC动态

1年前 (2024)

清华接手，YOLOv10问世：性能大幅提升，登上GitHub热榜

YOLO（You Only Look Once）系列作为实时目标检测领域的主要范式，近日迎来了YOLOv10这一重大升级。该新版本由清华大学的研究团队推出，通过后处理和模型架构...

AIGC动态

1年前 (2024)

12年前上手深度学习，Karpathy掀起一波AlexNet时代回忆杀，LeCun、Goodfellow等都下场

自2012年AlexNet在ImageNet竞赛中取得突破性成绩，标志着深度学习革命的开始，至今已过去12年。AI研究科学家Andrej Karpathy的一条帖子引发了AI界多位知名人...

AIGC动态

1年前 (2024)

开源模型越来越落后？Llama 3 说李总你真幽默

Llama 3 正式发布，被 Meta 宣称为迄今为止最强大的开源大模型。这一版本推出了两种规模的预训练语言模型，分别拥有 80 亿和 700 亿参数，以支持更广泛的应用...

AIGC动态

1年前 (2024)

Google：如何为AI和分析工作负载定义存储架构

本文讨论了构建大规模AI/ML数据管道的方法，并探讨了如何选择适合的存储方案来优化各类AI/ML工作负载。文章中，来自Google和Toyota的专家分享了他们的经验和...

AIGC动态

1年前 (2024)

标签：性能优化

新PyTorch API：几行代码实现不同注意力变体，兼具FlashAttention性能和PyTorch灵活性

阿里开源新语音模型，比OpenAI的Whisper更好！

思特威正式发布子品牌飞凌微，首发产品定位智驾视觉处理

两天内，Meta 和 Mistral 两款主流大模型打擂台！已经不仅卷性能了，谁更便宜就用谁？

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer

Mamba-2新架构出世一统江湖！普林斯顿CMU华人再出神作，性能狂飙8倍

清华接手，YOLOv10问世：性能大幅提升，登上GitHub热榜

12年前上手深度学习，Karpathy掀起一波AlexNet时代回忆杀，LeCun、Goodfellow等都下场

开源模型越来越落后？Llama 3 说李总你真幽默

Google：如何为AI和分析工作负载定义存储架构

热门网址

标签：性能优化

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址