Xilinx推出适应性强的加速卡可以胜过服务器中的GPU

导读 Xilinx正在通过今天推出的Alveo U50数据中心加速器，将其推向自适应和智能计算。该卡是业界首款支持PCIe Gen 4的低调自适应加速器，旨在

Xilinx正在通过今天推出的Alveo U50数据中心加速器，将其推向“自适应和智能计算”。

该卡是业界首款支持PCIe Gen 4的低调自适应加速器，旨在通过一个可重新配置的平台为各种关键计算，网络和存储工作负载增压。

它可用于机器学习推理，视频转码，数据分析，计算存储，电子交易和财务风险建模等应用。

Alveo U50为客户提供可编程的低配置和低功耗加速器平台，专为横向扩展架构和任何服务器部署，内部部署，云端和边缘的特定于域的加速而构建。

为了应对云计算微服务等新兴动态工作负载的挑战，与图形处理单元(GPU)或中央处理器(CPU)相比，Alveo U50在吞吐量，延迟和功率效率方面的性能提高了10倍到20倍。

据加利福尼亚州圣何塞市的Xilinx称，对于加速网络和存储工作负载，U50卡可帮助开发人员识别并消除延迟和数据移动瓶颈，方法是将计算更接近数据。

Alveo U50卡采用Xilinx UltraScale +架构，是Alveo产品系列中首款采用半高半长外形和低功耗75瓦功率封装的产品。

该卡具有高带宽内存(HBM2)，100千兆位/秒(100 Gbps)网络连接，并支持PCIe Gen 4和CCIX互连。通过安装到标准PCIe服务器插槽并使用三分之一的功率，Alveo U50扩展了可部署适应性加速的范围，从而为要求苛刻的计算，网络和存储工作负载提供了显着的吞吐量和延迟改进。

8GB的HBM2可提供超过400 Gbps的数据传输速度，而QSFP端口可提供高达100 Gbps的网络连接。高速网络I / O还支持高级应用程序，如NVMe-oF解决方案(NVM Express over Fabrics)，分解计算存储和专业金融服务应用程序。

Alveo U50基于Xilinx的现场可编程门阵列(FPGA)技术，可为任何服务器部署带来可编程性，灵活性，高吞吐量和低延迟性能优势。

Xilinx表示，与固定架构替代方案不同，Alveo U50的软件和硬件可编程性使客户能够满足不断变化的需求并优化应用程序性能，因为工作负载和算法不断发展。

Alveo U50可用于：

深度学习推理加速(语音转换)：与仅支持GPU的语音转换性能相比，每个节点的延迟降低25倍，吞吐量提高10倍，并显着提高每个节点的电源效率

数据分析加速(数据库查询)：运行TPC-H查询基准测试，Alveo U50每小时吞吐量提高4倍，与内存CPU相比，运营成本降低3倍

计算存储加速(压缩)：与仅CPU节点相比，提供20倍压缩/解压缩吞吐量，更快的Hadoop和大数据分析，以及每个节点成本降低30%以上

网络加速(电子交易)：与仅CPU延迟10us相比，延迟降低20倍，交易时间低于500ns

财务建模(网格计算)：运行蒙特卡罗模拟，与仅使用GPU的性能相比，Alveo U50的功效提高了7倍，从而更快地实现了洞察力，确定性延迟并降低了运营成本

“对数据中心不断增长的需求正在将现有基础设施推向极限，从而推动对适应性解决方案的需求，这些解决方案可以优化各种工作负载的性能，延长现有基础架构的生命周期，最终降低TCO，”执行官Salil Raje说道。 Xilinx数据中心集团副总裁兼总经理发表声明。“新的Alveo U50为数据中心工作负载带来了优化的外形和前所未有的性能和适应性，我们继续与不断增长的应用合作伙伴生态系统构建解决方案堆栈，为各行各业提供以前无法想象的功能。”

该公司引用了Advanced Micro Devices，IBM和Western Digital的支持。

“凭借Alveo U50的较小设计和先进功能，Xilinx可以通过可配置逻辑扩展加速市场，”Moor Insights&Strategy的HPC高级分析师Karl Freund说道。“新的Alveo U50应该能够突破市场噪音，并在高增长的使用案例中展现出显着的性能优势。”

Alveo U50现已开始提供OEM系统认证，并将于2019年秋季上市。赛灵思将于8月6日举行的Flash存储器峰会(FMS)2019展台展示Alveo U50和其他产品演示。到8月8日在加利福尼亚州圣克拉拉的圣克拉拉会议中心。