您当前的位置:主页 > 当贝市场 >

GDDR6给FPGA带来的大带宽存储优势以及性能测试

作者:admin     发布时间:2021-12-05 02:54 点击数:

  随着互联网时代的到来,人类所产生的数据发生了前所未有的、爆炸性的增长。预测,全球数据总量将从2019年的45ZB增长到2025年的175ZB[1]。同时,全球数据中近30%将需要实时处理,因而带来了对

  在这样的数据高速增长的情况下,用于传输数据的网络带宽和处理数据所需要的算力也必须急速增长。传统的CPU已经越来越不堪重负,所以用硬件加速来减轻CPU的负担是满足未来性能需求的重要发展方向。未来的硬件发展需求对于用于加速的硬件平台提出了越来越高的要求,可以概括为三个方面:算力、数据传输带宽和存储器带宽。

  Achronix的新一代采用台积电7nm工艺的Speedster 7t FPGA芯片根据未来硬件加速和网络加速的需求,在这三个方面都做了优化,消除了传统FPGA的瓶颈。下面我们重点说一说为了提高存储器带宽,Achronix通过采用硬核GDDR6控制器所带来的优势。

  在GDDR的设计之初,其定位是针对图形显示卡所特别优化的一种DDR内存。因为2000年后电脑游戏特别是3D游戏的发展和火爆,使运行电脑游戏的显卡需要有大量的高速图像数据交互需求,GDDR在这种情况下应运而生。第一个GDDR标准是基于DDR的GDDR2,随后发展到了基于DDR3的GDDR5,在一段时间中非常流行。

  2016年,GDDR5X正式发布,它引入了具有16n预取的四倍数据速率模式,但代价是访问粒度从GDDR5的32Byte提高到了64Byte。2018年,GDDR6发布,数据速率达到了16Gbps,带宽几乎是GDDR5X的两倍,同时采用了双通道设计,访问粒度和GDDR5一样是32Byte。

  GDDR一直以来是针对图形显示卡所优化的一种DDR内存。因为显卡处理图像数据,特别是3D图像数据对显存带宽的要求更高,GPU和GDDR之间的数据交换非常频繁。而DDR内存专注于与CPU进行数据交换的效率,因此对于整体存取性能、低延迟更为看重,所以在CPU和传统的FPGA中基本都是用DDR4。

  随着硬件加速需求对于存储器的带宽提出了越来越高的要求,传统的DDR4带宽显然已经无法满足要求,Achronix看重了GDDR6在数据存储中的带宽优势,创新地将GDDR6引入到了FPGA,彻底解决了传统FPGA存储带宽不够的瓶颈。

  2020年7月15日,JEDEC存储协会正式发布了DDR5 SDRAM的标准(JESD79-5),内存的频率相对DDR4的标准频率有了大幅的提升,总传输带宽也提升了38%,但是还是和GDDR6的带宽有一定的差距。如图2所示[2],GDDR6和DDR4/5的带宽对比。

  如果实现同一个大带宽存储的应用,在提供相同的存储器带宽的情况下,无论在设计复杂度,PCB占用面积,还是在功耗方面,与DDR4相比,GDDR6的性能都有很大的提高,如图3所示[2]。

  HBM全称High Bandwidth Memory,最初的标准是由JEDEC在2013年发布。2016年1月,HBM的第二代HBM2正式成为工业标准。HBM的出现也是为了解决存储器带宽问题。与GDDR6不同的是,HBM内存一般是由4个或者8个HBM的Die堆叠形成,我们称之为一个Stack。如图4所示[4]。

  从成本上来看,目前GDDR6与HBM2相比有着很大的优势,HBM2技术工艺要求高,目前芯片的良率和产量都会受到很大的影响。同时GDDR6使用起来更灵活,使用片外的DRAM,可以根据应用要求,选择不同速率,不同容量的GDDR6颗粒。HBM2的优势在于集成度高,不占用PCB板的面积。图5是DDR4、GDDR6和HBM2在成本上的一个综合比较。

  GDDR6结构如图6所示[3]。它是采用16n Prefetch结构,一次写操作或者读操作的数据是16n。每个GDDR6颗粒有两个独立的通道,每个独立的通道访问独立的内存空间。对于每个通道,读或者写的位宽是256bit或者32Byte。P-to-S converter是一个并变串的转换器,把每个256bit位宽的数据转换成16位总线bit的数据。这样GDDR6每个通道最小的访问粒度是256bit或者32Byte。

  一个GDDR6控制器支持两个独立通道,一个GDDR6颗粒也是两个独立的通道,所以在通常模式下,一个GDDR6控制器对应一个GDDR6的颗粒,用x16模式,实现最高512Gb/s的带宽。

  因为目前市面上GDDR6颗粒的最大容量是16Gb,在有些应用中如果对容量有一定的要求,可以使用一种叫Clamshell的连接方式,如图7[5]所示,每个GDDR6控制器连接两个GDDR6颗粒,每个GDDR6的颗粒用x8模式,这样在这种Clamshell模式下,带宽不变,但是支持的GDDR6的容量翻倍了。

  最后,我们测试一下7t1500上GDDR6控制器的读写效率,所有的测试结果基于仿线包含了片上网络(NoC),并且NoC已经实现了仲裁,时钟域转换的逻辑,我们用三个用户逻辑通过NoC去访问同一个GDDR6 Channel,得到的综合读写效率更能反映用户实际运用中的场景。

  后面我们会继续深入了解Speedster 7t FPGA芯片上的一些特性,以及这些特性如何运用在数据加速和网络加速中,敬请期待。 如需更多信息或者有任何疑问您可以通过Achronix公众号里的联系方式联系我们,也可访问Achronix公司官方网站

  如果需要进一步联络Achronix中国区技术和产品应用团队,请发送邮件到:dawson.

  双十一已经过去了,可能有部分小伙伴因为种种原因错过了买买买的机会,但是,别担心,朗科的存储产品在双十....

  现在,企业数字化加速创新,各行业对高品质的数据基础设施需求增加,因此我国在新基建领域不断加大投入,并....

  FPGA如何对引脚进行分块?是由VCC的电压不同进行自行设计分块?还是每个块的引脚都是固定的? 在进行DDR3与...

  XC7Z015-2CLG485I 供应商 XC7Z015-2CLG485I怎么订货 XC7Z015....

  HMC-ALH140 是两级 GaAs MMIC HEMT 低噪声放大器芯片,工作频率在 24 至 ....

  HMC-ALH435 优势性能 HMC-ALH435 特征HMC-ALH435  应用

  XC7A100T-2FGG676I 芯片详细信息如图XC7A100T-2FGG676I 供应商XC....

  FPGA、PLC、STM32、Arduino、单片机、计算机等概念间的关系、区别及各自的优缺点入门之初,对于标题所列各...

  摘要:不知道小伙伴们点亮过多少板子的LED灯,有很多小伙伴留言说讲一下stm32、fpga、liunx他们之间有什么不同,不...

  XC7S25-2CSGA225I供应商XC7S25-2CSGA225I怎么订货XC7S25-2CSG....

  自己对FPGA刚开始学习,但又特别需要用到FPGA实现OOK的调制解调,求帮忙,由于是新人,还只有一个积分,太...

  (作者 :浪潮信息首席架构师 叶毓睿)全球存储性能委员会(SPC)是由世界级存储供应商联合组成的一个....

  1.为什么说DSP+FPGA架构更适合视频采集处理?高性能的算法处理,使用硬件描述语言去编写算法的话....

  电子发烧友网报道(文/黄晶晶)ABI研究数据表明,预计到2024年设备端的AI推理功能将覆盖近60%....

  CPLDComplex Programmable Logic Device复杂可编程逻辑器件FPGAField Programmable Gate Array现场可...

  平台扩展了客户在从神经网络诊断到工业物联网 (IIoT) 和工厂自动化等应用中设计安全可靠系统的选择....

  EDA作为数字化产业的底层关键技术,自始至终连接并贯穿了芯片与科技应用的发展。未来的数字化系统,将是....

  目录一、问题:二、大小端:三、结论:四、解决方案五、常见mcu的大小端一、问题:某次,在对某mcu flash进行操作时,...

  通过遵循推荐的电源序列,可以避免在启动期间吸取过大的电流,这反过来又可防止器件受损。对一个系统中的电源进行排序...

  请问怎样才能得到ADS454J64EVM、TSW14J64EVM评估板中的FPGA中的程序源代码?有什么技术资料支持吗?

  我们最近在用这个做项目,但是发现官网没有这两个评估板相关的开发资料,请问那里有这两个的技术资料吗?也期待和大家...

  尽管经历了收购和洗牌等一系列事件,FPGA市场依然处于一个相对来说被垄断的局面,Intel(Alte....

  电子发烧友网报道(文/黄晶晶)根据2021年上半年DRAM市场情况来看,长鑫存储的全球市占已经来到1....

  每个GDDR6的硬核支持双通道。总的带宽是16Gbps x 16(位宽) x 2(通道) x 8(控....

  1. 面积与速度的平衡与互换这里的面积指一个设计消耗FPGA/CPLD的逻辑资源的数量,对于FPGA可以用消耗的F...

  嵌入式开发是指利用分立元件或集成器件进行电路设计、结构设计,再进行软件编程(通常是高级语言),实验,....

  UV APS作为合见工软首次推出的EDA原型验证产品系列已通过业内客户的检验,全面覆盖各种验证场景的....

  IDG公司与数十位存储和数据管理专家进行了交流和探讨,就企业需要采取哪些措施为其选择合适的数据存....

  11月17日,芯华章科技股份有限公司宣布朱洪辰(Joyee Zhu)于2021年11月2日加盟芯华章....

  先进半导体解决方案的主要供应商瑞萨电子公司今天宣布,它正在进入现场可编程门阵列 (FPGA) 市场,....

  【科普】CAN总线介绍及FPGA实现方案简介 这里我们先逆推一下CAN总线的一些特点。 第一,CAN....

  拯救童年系列-GameBoy介绍及FPGA实现 这个掌上游戏机应该不需要过多言语,大部分的80后、9....

  FPGA和USB3.0通信-硬件测试(一)SDK的安装 本次演示用的是USB3.0芯片-CYPRES....

  随着英特尔第12代酷睿的问世,NVMe SSD全面进入PCIe 4.0时代,但PCIe 3.0 SS....

  瑞萨电子今日宣布,推出全新超低成本、超低功耗现场可编程门阵列(FPGA)产品家族。

  优秀的 Verilog/FPGA开源项目介绍(七)- CAN0、CAN总线介绍《【科普】CAN总线介....

  在硬件加速器应用中,FPGA常被视为最优解,提供极致加速性能的同时,还具备重新编程的能力。尽管其灵活....现场报码开奖结果

关闭窗口

网站首页  | 当贝官网  | 当贝市场  | 当贝市场官网  | 当贝市场TV版  | 当贝市场APK  | 社区  | 新闻中心  | 企业文化  | 地方资讯

手机最快报码开奖现场,手机快速查看开奖记录,本港台现 报码开奖台,手机即时现场直播报码,手机现场报码开奖直播b,123jkco手机现场开奖