标签:技术管理

发论文亲自上?创业十多年,DeepSeek梁文锋的“技术男”属性从没改变

DeepSeek团队近日发布新论文,提出名为Native Sparse Attention(NSA)的新型注意力机制。该机制通过动态分层稀疏策略,结合粗粒度标记压缩与细粒度标记选择...