AI计算卡简介
Aladin人工智能计算卡为数据中心的AI推理应用而打造。作为通用深度学习推 理加速器,外形规格采用双槽PCIe Gen4 x16的全高全长的设计方式。目前有2款计算卡,T30、T40。T30计算卡支持60
GB LPDDR4x内 存,理论内存峰值带宽252 GB/s,最大功耗250 W。被动冷却板设计使其在热限制内,通过系统气流来实现 计算卡的操作。
T30计算卡基于某国产GPU架构构建。通过软硬件紧密结合的架构设计,强调平衡的结构化稀疏性,支持 高达32倍的高稀疏率。基于GPU架构,T30计算卡支持BF16和INT8计算。同时,T30计算卡支持包括集成
模型稀疏器的软件工具链、编译器和运行时在内的端到端软件解决方案,确保主流AI推理作业可以快速 实现。