华夏芯产品技术概述

news/发布时间2024/5/22 7:14:44

华夏芯产品技术概述

 

GPTX1 CPU

概述:

GPTX1 CPU是华夏芯完全自主知识产权、自主架构的面向嵌入式的高能效CPU核。此CPU核依托Unity指令集,针对先进半导体工艺对微架构和流水线进行了深度优化,能够在相同工艺下达到更高的主频和更高的能效,应用于网络、通讯、数字电视、存储等广泛领域。

GPTX1是华夏芯统一处理器平台(Unity Platform)的第一代产品,具有灵活、可配置的特点。

 

GPTX2 CPU

概述:

GPTX2 CPU是华夏芯完全自主知识产权的多核处理器IP,支持从单核到四个GPTX2 CPU内核的处理器集群。GPTX2 CPU内核是基于Unity架构的64位超标量处理器,拥有高度优化的3发射流水线,支持混合分支预测和乱序猜测执行。非一致的寄存器堆使超标量流水线能运行到更高的主频,在编译器技术的辅助下,可以对处理器的许多功能部件起到加速的作用。

GPTX2架构基于先进工艺设计,提供卓越的性能和能效比,适合于辅助驾驶系统(ADAS)、机器人、AR/VR、智能监控、边缘计算等嵌入式领域的高性能并行计算应用。

 

软件开发平台:

GPT软件开发平台由编译系统、模拟器、调试工具、图形化集成开发环境、Linux/RTOS操作系统、基础库和针对应用优化的高级库组成,为用户提供完整的嵌入式软件开发方案。

GSNN

概述:

 

GSNN主要用于智能手机、智能监控、智能摄像头、智能音箱、智能烟雾探测器、智能ISP、智能物联网、边缘计算等嵌入式人工智能设备中神经网络、图像信号处理和并行DSP算法的计算加速。

GSNN微架构

 

 主要特点:

● 以程序控制下的异构引擎驱动
● 针对高维度张量进行计算加速
● 擅长多任务、多数据并行计算
● 易于编程,创建深度学习生态
● 高性能、低功耗、低成本设计
● 针对DNN,CNN神经网络进行优化
● 针对矩阵和向量计算进行优化

主要加速领域 (华夏芯支持用户定制图像处理和神经网络加速算法库)

 

 

 

系统运营:前后台协同开发与发布神经网络软件

 

华夏芯第二代AI加速器IP: WNN

概述:

WNN是华夏芯第二代AI加速器IP,除了能够直接加速卷积神经网络,还能够直接运行常见的网络框架,如TensorFlow、Caffe、PyTorch,DarkNet等,支持用户定制化的网络和计算类型
功能特点:

● 数据类型

○ 16位浮点

○ 8位定点

○ 8位/4位整数

● 网络压缩

○ 稀疏矩阵

○ 剪枝

○ 权值共享

● 张量计算

○ Point wise

○ Depth wise

○ 4 dimensions

● 网络层

○ Conv

○ Full connection

○ Pooling

○ Activation

深度学习框架加速

 ISP

概述:

支持传统的黑电平校正、坏点校正、帧率变换、去马赛克颜色插值、2D降噪、3D降噪、宽动态HDR、去雾、3A(自动曝光AE、自动白平衡AWB和自动对焦AF)、透镜阴影校正、颜色空间转换、色彩校正、tone mapping、对比度调整、亮度和色度调整、锐度调整、gamma校正、图像缩放、图像切割、测试模板生成和3D景深图实时生成等功能。

针对AI运用,在图像特征数据统计、场景匹配优化、自动图像调优和图像处理算子等方面做了增强。对ISP前端和AI处理器的配合,做了合理的功能划分、处理协同,配合GPT的AI处理器,在视频图像处理AI运用上,可获得很好的的性能、功耗和成本优势。

IP具有灵活的高可定制性,即可满足超低成本运用,也以3D降噪、去雾、宽动态和AI前端图像处理算子等高级功能满足用户更高的图像前处理需求。

 

其他ISP:

GPT先进的双模RGB-IR sensor双光融合ISP具备图像细节增强、引导滤波、4X4 RGB-IR去马赛克内插、伪彩渲染、图像融合等功能。降低了传统的红外成像方案成本,为基于反射原理的近红外、短波红外成像以及基于热辐射的中波、长波热成像都提供了相应的解决方案。

GPT的可见光RGB和红外双模ISP为安防、face ID、活体检测、图像增强、透雾、火警检测和图像降噪等运用带来高性能、低成本方案,如可用单RGB-IR sensor替代传统的RGB+Mono双摄方案,有效避开了双sensor带来的对模组生产工艺、ISP图像配准、自动对焦、光学防抖等产生的一系列问题。

软件开发平台:

Tuning软件和ISP基础SDK开发包为用户提供完整的ISP软件开发方案。

 

● 快速部署用户应用到WNN平台,加速过程与GPU相似,对用户基本透明
● 支持动态网络

深度学习网络加速

 

● 脱离深度学习框架,程序效率(速度和内存占用)更高
● 支持静态网络推理的优化(压缩、剪枝等)

华夏芯第一代AI加速器IP : GNN

概述:

GNN是华夏芯新一代AI加速器IP,编译器为每个网络构建自定义FPGA位流

 

功能特点:

● FPGA利用率高,性能优,功耗低

○ 适用于数据中心(超大规模负载的实时AI处理)和嵌入式应用

● 单管道,较低延迟

○ 适用于需要实时性能的应用

○ 视频流对象检测与识别

GNN开发流程

● 在python中定义神经网络:当前,从执行TensorFlow模型中提取;开发中,直接从TensorFlow和Caffe定义生成

● 将Python描述转换为可合成代码

● GNN生成用户滤波器

● 生成可综合HDL、生成xdc文件

● 使用Vivado 生成bit流

SoC芯片平台> GP 3600

GP 3600系列芯片的概况介绍:

基于自主开发的低功耗异构多核DSP芯片,采用先进CMOS工艺量产,支持多指令、硬件多线程、多矢量并行计算,拥有良好的一体化编程和调优环境,便于通过软件定义方式快速实现客户定制化需求,面向智能物联网(AIoT)、嵌入式人工智能(Embedded AI)和软件无线电(LPSDR)等应用领域的芯片级特色平台。

超低功耗端侧物联网暨人工智能主芯片平台与解决方案

芯片系列:GP 3600,GP 3700等

以软件定义方式快速定制超低功耗下的物联网、智能物联网和人工智能方面的典型应用;

以单一芯片方式快速实现目标识别、人脸识别、语音识别、二维码、NB/LORA IoT等产品集成;

主要优势:平台战略、快速定制、在线升级、超低功耗﹑超低成本、高集成度﹑便于维护;

典型应用:工业物联网、智能抄表﹑智能门禁﹑智能消防、智能显示屏、智能音箱、智能会议系统﹑智能家电﹑智能家居、软件无线电、专网通讯等。

 

SoC芯片平台> GP 8300

概述:

GP8300是面向视觉分析和AI加速计算的高性能SOC,用28nm工艺设计,集成了华夏芯自主Unity架构的4核64位超标量CPU和2核AI专用处理器,适用于辅助驾驶(ADAS)、智能监控、机器人、边缘计算等应用。

GP8300 视觉分析SOC技术规格:

 

应用场景:

 

 FPGA板卡> 可编程AI加速卡

概述:

这款可编程AI加速器卡具备 FPGA 加速的强大性能和多功能性,可部署华夏芯AI加速器IP(WNN/GNN,直接加速卷积神经网络,直接运行常见的网络框架),为应用和加速器函数开发人员提供了完整的开发工具SDK,节省开发时间,支持在多个平台上重复使用代码。凭借PCIe插槽外形、低功耗和被动式散热器,可以部署在各种服务器上。采用Xilinx® Ultrascale® VU7P /VU9P FPGA 的多功能可编程加速卡,适用于许多细分领域,如大数据分析、人工智能、基因组学、视频转码、网络安全和金融交易等。

 

应用场景

数据中心

基因组学

网络安全

智慧金融

FPGA板卡> 编解码加速卡

概述:

对于H.265/HEVC/VP9编解码处理,FPGA编解码加速卡方案有着完善的功能和preset配置,支持最多的有利于提高画质和降低bitrate的功能,适合各个场景下编解码配置。同时具有灵活部署,易于升级的特点,可根据需求,随时更换成其他协议的编解码功能。非常容易的在同一块FPGA上pipeline部署编解码相关的上下游应用。成本方面,可以显著降低带宽成本、存储成本。

 

 

应用场景:

图片转码

视频文件编解码

直播视频编解码

FPGA板卡> 智能网卡

概述:

华夏芯智能网卡提供网络、存储、安全等方面的加速,这些功能从服务器CPU卸载到智能网卡上,能够提升应用程序和虚拟化性能,确保为应用提供最大的处理能力。与此同时,网卡提供异构互联支持,支持不同类型的服务器,也支持不同的运行模式,包括VM、Container或者Bare Metal等,使得服务器部署更灵活,使用更方便。

 

 

目的:卸载计算/存储外的功能到网卡上,使得服务器更加专注于计算,更加高效。

● 算法:提供智能分析,智能识别等功能;

● 网络:提供网络转发功能加速,例如QoS,NAT,OVS等;

● 存储:提供存储管理功能加速,例如Dedupe,NVMe等;

● 安全:提供安全辅助功能,包括加解密、深度报文检测等。

好处:

● 低成本:节省服务器CPU资源用于计算,降低TCO;

● 低时延:FPGA网卡处理报文转发,高并发,低时延;

● 易扩展:基于网卡的支持,服务器规模可扩展性更好;

● 异构支持:智能网卡兼容支持不同类型的服务器,不同运行模式;

● 缩短TTM:利用现成的智能网卡,缩短业务TTM时间。

使用场景:

● 云计算:卸载网络及存储管理功能,提高服务器计算速度。

● CDN:卸载网络,数据智能化分析处理。

● 数据检索:提高数据检索性能,包括特征提取、算法匹配、结果分析等;

● 数据挖掘:提高数据深度学习能力,尤其在边缘侧完成算法分析,可以有效缩短时延,减少交互带宽。

● 安防:提供安全辅助功能,包括加解密、深度报文检测等。

● 图像视频分析:基于FPGA实现AI算法,提高处理速度。包括图像视频编解码、人脸识别等。

● 存储管理:分布式存储管理,以及协议转换,支持RoCE、iWARP、NVMe over Fabric, etc.

 

 

参考文献链接

http://www.hxgpt.com/index.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ulsteruni.cn/article/86021515.html

如若内容造成侵权/违法违规/事实不符,请联系编程大学网进行投诉反馈email:xxxxxxxx@qq.com,一经查实,立即删除!

相关文章

测试与发布

目录测试报告一、bug的发现与解决二、场景测试(scenario testing)发布说明一、功能说明二、对运行环境的要求三、安装方法四、已知的限制和缺陷五、发布方式和发布地址 测试报告 一、bug的发现与解决1.在测试过程中总共发现了多少Bug?每个类别的Bug分别为多少个? 答:共发现…

8086 汇编学习 Part 5

流程转移 背景 一般情况下指令是顺序地逐条执行的,而在实际中,常需要改变程序的执行流程。 转移指令可以控制 CPU 执行内存中某处代码的指令。 可以修改 IP ,或同时修改 CS 和 IP 的指令。分类 按转移行为分类段内转移 : 只修改 IP (例如 JMP AX) 段间转移 : 同时修改 C…

win10 hyper-v 配置教程

非家庭版跳过以下这一步。 pushd "%~dp0"dir /b %SystemRoot%\servicing\Packages\*Hyper-V*.mum >hv.txtfor /f %%i in (findstr /i . hv.txt 2^>nul) do dism /online /norestart /add-package:"%SystemRoot%\servicing\Packages\%%i"del hv.txtDi…

嵌入式Linux,openssh连接报错:ssh_sandbox_violation: unexpected system call

背景: 使用buildroot编译完镜像,烧录到开发板,板子上电启动后,网络正常,ssh不能连接,sshd相同配置在其他机器上可以正常使用; 查看内核日志,看到连接时上报异常系统调用的错误:Jan 1 00:01:18 NanoPC-T2 auth.crit sshd[278]: fatal: ssh_sandbox_violation: unexpec…

30 秒出服装设计稿,森马用函数计算+AIGC 整“新活”!

2023 年初,森马希望迅速将 AI 技术深度融入到企业的核心业务流程中,实现服装行业中,从产品设计、生产制造、营销推广到售后服务的全链条智能化升级。在一个阳光明媚的下午我们走进森马,一起聊聊这个陪伴一代代中国年轻人成长的企业,如何基于阿里云函数计算,快速实现传统服…

BurpSuite连接浏览器代理无法打开部分网页问题

BurpSuite连接浏览器代理时,部分页面能打开,部分页面报错的可能有效的解决方法。本人写这篇记录时,尚未熟悉bp基本操作,仅记录该次探索bp功能解决问题的心路历程。 发现并解决问题 最近两天为能打开尘封已久的bp,抓包做题,卸载了jdk20,下了jdk1.8(高版本jdk破解用的jav…