思元370芯片系列芯片概述
基于7nm制程工艺,思元370是寒武纪首款采用chiplet(芯粒)技术的AI芯片,集成了390亿个晶体管,最大算力高达256TOPS(INT8),是寒武纪第二代产品思元270算力的2倍。凭借寒武纪最新智能芯片架构MLUarch03,思元370实测性能表现更为优秀。思元370也是国内第一款公开发布支持LPDDR5内存的云端AI芯片,内存带宽是上一代产品的3倍,访存能效达GDDR6的1.5倍。搭载MLU-Link™多芯互联技术,在分布式训练或推理任务中为多颗思元370芯片提供高效协同能力。全新升级的寒武纪基础软件平台,新增推理加速引擎MagicMind,实现训推一体,大幅提升了开发部署的效率,降低用户的学习成本、开发成本和运营成本。
核心优势
思元370系列板卡与业内主流GPU性能对比
了解寒武纪思元370智能加速卡
MLU370-S4/S8智能加速卡面向高密度云端推理
MLU370-S4/S8加速卡采用思元370芯片,TSMC 7nm制程,寒武纪新一代人工智能芯片架构MLUarch03加持,支持PCIe Gen4,板卡功耗仅为75W,相较于同尺寸GPU,可提供3倍的解码能力和1.5倍的编码能力。MLU370-S4/S8加速卡的能效出色,体积小巧,可在服务器中实现高密度部署。
产品规格
硬件合作伙伴
MLU370-S4/S8智能加速卡面向高密度云端推理
MLU370-S4/S8加速卡采用思元370芯片,TSMC 7nm制程,寒武纪新一代人工智能芯片架构MLUarch03加持,支持PCIe Gen4,板卡功耗仅为75W,相较于同尺寸GPU,可提供3倍的解码能力和1.5倍的编码能力。MLU370-S4/S8加速卡的能效出色,体积小巧,可在服务器中实现高密度部署。
产品规格
MLU370-X8 智能加速卡训推一体人工智能加速卡
产品规格
参考文献链接
https://cambricon.com/index.php?m=content&c=index&a=lists&catid=360