英特尔推出新一代Stratix 10 FPGA加速卡:性能提升3倍

简介: 去年 10 月,英特尔发布了面向服务器的 FPGA 计算卡 Arria 10,并于今年 4 月宣布其已被部署在主流服务器中。时间仅过去不到一年,我们就看到了 Arria 的继任者。9 月 26 日,这家芯片科技巨头宣布推出 Stratix 10 SX FPGA 的全新可编程加速卡。


英特尔的第二代 FPGA 计算卡仍面向数据中心,带来了更高的内存容量和带宽,其搭载的 280 万个逻辑单元数量为上一代 Arria 10 的两倍,这也使它成为了目前带宽最高的可编程加速平台。这款 PAC 加速卡专为内嵌处理和内存密集型工作负载而构建,如数据流分析和视屏转码。Hewlett Packard Enterprise(HPE)将是新卡的第一个 OEM 厂商。


微信图片_20211130103317.jpg


在新计算卡的性能参数上,值得注意的是功耗:新卡 225W 的最大功耗相比 75W 的第一代产品增加了很多,高能耗也带来了更强大的计算性能。另外,Stratix 10 采用了 4 通道 DDR 4DIMM 内存(容量为 32GB);计算卡尺寸为 3/4 长,采用双槽 PCIE 3 插槽(前代产品为单槽设计)。


对于英特尔而言,新计算卡丰富了其 FPGA 计算卡的产品线。Stratix 10 在片上和片外存储方面有了大幅增长,其片上存储容量是前一代的四倍。大幅增长的内存储带来了更高的吞吐量,让这些计算卡更加适用于实时视频数据分析和转码等应用。而容量为 32G 的 DDR 4 内存则可以让绝大多数应用程序在其上运行得更快。


虽然目前还没有放出基准测试成绩,但和广泛占据市场份额的 GPU 产品相比,Stratix 10 从架构上来看具有一些优势:其板载以太网单元可支持内嵌处理,帮助用户实现实时的数据分析,这可以为零售等行业带来竞争上的优势。英特尔称,和 Arria 10 加速卡相比,从速度和成本上来看,第二代产品有了 3 倍的性能提升。


微信图片_20211130103320.jpg


英特尔旗下的 FPGA 计算卡已经投入市场超过一年时间,因其性能/功耗比的优势,Arria 10 在图像处理领域已有一些应用案例。另一方面,金融领域也是英特尔希望努力进入的市场。Stratix 10 的高带宽在风险管控任务中的表现也值得期待。


实时数据分析是另一个重要市场方向,此前的 Arria 在零售业等行业的数据中心已有一些应用,而 Stratix 10 可以为各家企业带来更高的带宽,以及更大的分析空间。


「Stratix 10 有强大的计算能力,另一方面,这张计算卡还有片上以太网接口。当接入数据流时,算法分析可由 FPGA 进行实时加速,而基于 Spark 的软件堆栈可以帮助开发者进行快速部署。」英特尔 PSG 部门总监、加速平台市场负责人 Sabrina Gomez 介绍道。


微信图片_20211130103323.jpg

英特尔新推出的 Stratix 10 FPGA 计算卡面向更高性能需求的应用。


除了自产的 FPGA 加速卡之外,本次英特尔还提供了支持旗下 Xeon 处理器和 FPGA 芯片的加速栈,包括一套常用的 API 和开源驱动程序。英特尔称,它们能够与行业领先操作系统、虚拟化及协调软件无缝配合。「不管开发者过去的技能水平如何,他们都可以很容易地接收英特尔的产品。英特尔的开发工具质量很高,也有很多合作伙伴支持。」英特尔亚太区产品市场经理谢晓东介绍道。


一个月前,英特尔在 VMworld 上推出了支持虚拟化的框架。现在,客户已经可以直接在 FPGA 加速卡上做 VMware 虚拟化了。


在操作系统方面,英特尔表示自己和 OEM、IP、操作系统和集成设备厂商进行了合作,将 FPGA 驱动上传到 Linux 内核中,从而得到了广泛的 Linux 支持。


针对 FPGA 平台,英特尔甚至推出了应用商店「Workload Store Front」,支持简单的评估和快速部署,用户在其之上可以找到各种工具,并「先试后买」。


HPE 副总裁兼 HPC 与 AI 事业部总经理 Bill Mannel 表示:「我们看到基于 FPGA 的加速器市场增长迅速,越来越多的开发人员都可采用全新的英特尔 FPGA 解决方案工具,实现工作负载加速。我们计划在新产品中使用英特尔 Stratix 10 PAC 和加速栈,以帮助客户轻松管理复杂及新兴的工作负载。」


微信图片_20211130103327.jpg

英特尔在 FPGA 加速器上提供了完整的解决方案。


对于定制化设计,英特尔也持开放态度。英特尔会向有需求的客户提供参考设计,帮助客户针对自己的需求选择加速卡配置,这家公司希望以此不断扩展加速产品的组合。


对于 FPGA 计算卡未来的市场,英特尔很有信心。「目前的计算卡市场,包含 GPU、ASIC、FPGA 等芯片形态,其体量为 180 亿-200 亿美元。单看企业级市场的话,规模为数十亿美元。在这其中,FPGA 因其独特的能力,会在其中占据很大一部分份额。」Sabrina Gomez 表示。


目前,英特尔的 FPGA 计算卡主要应用于各家企业的数据中心,这家公司希望未来 FPGA 也能在云端有更多部署。加速产品市场前景广阔,英特尔正处在有利的位置。未来,FPGA 或许会出现在更多基础设施、物联网设备之中。 微信图片_20211130092842.png


相关文章
|
存储 数据中心 异构计算
|
人工智能 数据安全/隐私保护 异构计算
|
1天前
|
算法 数据安全/隐私保护 异构计算
基于FPGA的1024QAM基带通信系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本文介绍了基于FPGA的1024QAM调制解调系统的仿真与实现。通过Vivado 2019.2进行仿真,分别在SNR=40dB和35dB下验证了算法效果,并将数据导入Matlab生成星座图。1024QAM调制将10比特映射到复数平面上的1024个星座点之一,适用于高数据传输速率的应用。系统包含数据接口、串并转换、星座映射、调制器、解调器等模块。Verilog核心程序实现了调制、加噪声信道和解调过程,并统计误码率。
13 1
|
22天前
|
算法 数据安全/隐私保护 异构计算
基于FPGA的64QAM基带通信系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本文介绍了基于FPGA的64QAM调制解调通信系统的设计与实现,包括信号生成、调制、解调和误码率测试。系统在Vivado 2019.2中进行了仿真,通过设置不同SNR值(15、20、25)验证了系统的性能,并展示了相应的星座图。核心程序使用Verilog语言编写,加入了信道噪声模块和误码率统计功能,提升了仿真效率。
40 4
|
22天前
|
监控 算法 数据安全/隐私保护
基于三帧差算法的运动目标检测系统FPGA实现,包含testbench和MATLAB辅助验证程序
本项目展示了基于FPGA与MATLAB实现的三帧差算法运动目标检测。使用Vivado 2019.2和MATLAB 2022a开发环境,通过对比连续三帧图像的像素值变化,有效识别运动区域。项目包括完整无水印的运行效果预览、详细中文注释的代码及操作步骤视频,适合学习和研究。
|
1月前
|
存储 算法 数据处理
基于FPGA的8PSK调制解调系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本系统在原有的8PSK调制解调基础上,新增了高斯信道与误码率统计模块,验证了不同SNR条件下的8PSK性能。VIVADO2019.2仿真结果显示,在SNR分别为30dB、15dB和10dB时,系统表现出不同的误码率和星座图分布。8PSK作为一种高效的相位调制技术,广泛应用于无线通信中。FPGA凭借其高度灵活性和并行处理能力,成为实现此类复杂算法的理想平台。系统RTL结构展示了各模块间的连接与协同工作。
47 16
|
27天前
|
算法 数据安全/隐私保护 异构计算
基于FPGA的16QAM基带通信系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本项目基于FPGA实现16QAM调制解调通信系统,使用Verilog语言编写,包括信道模块、误码率统计模块。通过设置不同SNR值(如8dB、12dB、16dB),仿真测试系统的误码性能。项目提供了完整的RTL结构图及操作视频,便于理解和操作。核心程序实现了信号的生成、调制、信道传输、解调及误码统计等功能。
38 3
|
4天前
|
算法 数据安全/隐私保护 异构计算
基于FPGA的256QAM基带通信系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR
本文介绍了256QAM调制解调算法的仿真效果及理论基础。使用Vivado 2019.2进行仿真,分别在SNR为40dB、32dB和24dB下生成星座图,并导入Matlab进行分析。256QAM通过将8比特数据映射到复平面上的256个点,实现高效的数据传输。Verilog核心程序包括调制、信道噪声添加和解调模块,最终统计误码率。
10 0

热门文章

最新文章

下一篇
无影云桌面