2.34纳秒超低时延,满足高频交易,AMD发布新一代金融加速卡

科技确有核芯 2024-11-11 21:08:41

电子发烧友网报道(文/黄晶晶)面对金融行业处理大量数据、即时交易的需求,AMD提供CPU到FPGA的全套解决方案支持快速地交易执行。其中,在资本市场,HFT(高频交易)对低时延格外看重,低时延是降低成本和获得利润的关键所在。

近日,AMD推出Alveo UL3422 加速卡,它是由 AMD Virtex UltraScale+ FPGA 提供支持,其采用新颖的收发器架构,具备硬化且经过优化的网络连接核,专为高速交易定制打造。它可实现超低时延交易执行,达到低于3纳秒的 FPGA 收发器时延和突破性的“tick-to-trade”性能,这是标准现成 FPGA 无法实现的。AMD Alveo UL3422为交易商、做市商和金融机构提供了一款针对机架空间和成本进行优化的纤薄型加速卡,旨在快速部署到各种服务器中。

高频交易的需求点

高频交易是使用算法非常迅速地实现tick-to-trade交易。它使用非常复杂的算法,以及要求非常高的硬件。通常是利用市场上非常小的价差以及市场的低效,在短时高频发生的交易来获得利润。

因此,高频交易主要有三大特点,一是要求低时延,只差几微秒可能就是盈利几百万美元到亏损之间的差别。二是基础设施也非常关键,要进行高频交易经常需要在交易所租用服务器,实现交易所的服务器共置,通过这样的方式来获得优势。有很多的高频交易公司都是在交易所非常接近的地方或者就是在交易所来部署基础设施。在机架上服务器的数量,对于高频交易来说也非常重要。三是算法也能够给高频交易带来优势,自适应计算还能够帮助高频交易的交易商来实现监管合规,这对于他们的效率也非常重要。

Alveo UL3422具有超低时延,且更具性价比

Alveo UL3422是AMD Alveo超低时延加速卡产品组合的一个最新成员,相比于一年前推出的Alveo UL3524,Alveo UL3422的设计更具有性价比,又能够保持Alveo UL3524的诸多优势。

Alveo UL3422具有精简功能集,与Alveo UL3524卡相比,它有优化的连接,以及板载内存。Alveo UL3422 加速卡减少了端口密度、板载内存和连接选项,但依然采用相同的 AMD Virtex UltraScale+ VU2P FPGA 来实现超低时延。

Alveo UL3422 加速卡具备787K LUT(可编程逻辑),支持PCIe 4.0 x8系统总线,并板载多达16GB内存。两个QSFP-DD模块提供了10G、25G网络端口;两个ARF6端口可以连接多张卡;PPS时钟同步1个输入接口,1个输出接口,可以和外部单元交互,获得精准时间戳。有非常纤薄的尺寸规格,全高、半长( FHHL )尺寸规格封装,适用于1U服务器,优化机架空间能够显著节省共置服务器的费用,也可以灵活适用于2U和4U服务器配置,可以增加每台服务器卡的数量。

AMD主要通过GTF收发器来实现超低延时的目标。AMD自适应和嵌入式计算事业部的高级产品线经理Shyam Chander解析,GTF和GTY两种收发器的网络协议都是一样的,但GTF收发器比之前的GTY收发器性能提升约7倍,时延从16纳秒降低到仅仅2.34纳秒,主要是实现了最大的硬化。而tick-to-trade这个时延能够降低40%到49%,相当于14纳秒(13.9纳秒),尤其是对于金融行业的交易来说,这是一个巨大的优势。

Shyam Chander进一步表示,GTY的收发器是能够在Virtex UltraScale+ 所有纳米级别的产品上都可以有的,包括16纳米。但是GTF仅仅是在Virtex UltraScale+ VU2P FPGA芯片上,专为超低时延市场开发的一款收发器,无论是Alveo UL3422,还是之前推出的Alveo UL3524都是基于这样的芯片,能够支持超低时延的应用需求。

Alveo UL3422加速卡可以用于支持算法、交易,FPGA和DSP块能够实现加速,能够执行客户的交易策略,它内置的RAM可以实现内存的迅速访问和存储,DDR4可以用于存储订单簿信息和历史定价的数据。

AMD提供不同的加速卡产品组合,应用各种算法交易用例,主要分为三类。第一类是时延低于20纳秒的超低时延FPGA,这类交易对速度要求高,算法要求简洁明了;Alveo UL3422和Alveo UL3524等产品可满足这类需求。第二类是时延低于100纳秒的低时延FPGA,包括FPGA和自适应的SoC,对时间的要求可以放松一些,算法复杂程度有所提高,数据的数量也会更加大,会进行更加深层次的历史模型的分析。Alveo V80可满足需求。

第三类是传统的CPU交易,延时低于1000纳秒,在处理过程中数据主要通过CPU的主机来进行处理和计算,数据传输是通过NIC实现的。Alveo X3522能够支持这些低时延的CPU交易,EPYC、锐龙都能够满足相关的工作负载和用例的需求。

生态合作,加快开发设计

Alveo UL3422 加速卡通过利用可用的基础设施生态系统解决方案和参考设计来实现快速部署,从而为交易开发人员提供快速完成设计并投入市场所需的优势。其由不断壮大的生态系统合作伙伴解决方案网络提供支持,这些解决方案提供 IP 和开发框架,以实现交易解决方案的快速实施。例如Exegy 是一家端到端前台交易解决方案提供商,它能够预构建的基础设施IP可以实现超低时延,运行时堆栈和API也简化了开发。Hypertec 是一家面向金融服务行业的硬件、云和增值解决方案提供商,Xelera Technologies 是一家面向高速网络技术和机器学习( ML )应用的软件提供商, 与 AMD 合作助力应对高频交易中机器学习算法的时延缺陷。

Alveo UL3422 采用 AMD Vivado 设计套件支持传统 FPGA 流程,并附带一套参考设计和性能基准,使 FPGA 设计人员能够快速探索关键指标并根据规范制定定制交易策略。

AMD 为开发人员提供了开源且受到社区支持的FINN开发框架,令低时延 AI 模型能够部署到高性能交易系统中。FINN 项目采用 PyTorch 和神经网络量化技术,旨在缩小 AI 模型尺寸的同时保持准确性。FINN 编译器可生成能与 AMD FPGA 共同使用的量化神经网络( QNN )硬件 IP 块。

小结

AMD的UL3422正是因为市场上客户既要数据传输快又要尺寸小价格合适,这实际是工作负载和网络节点需求之间的平衡。除了金融科技之外,在科研活动当中,很多数据馈送的处理需要交换机中来完成,如果有一个交换机能够实现超低时延,也是非常重要的要求,AMD同样看到了这样的应用趋势。

0 阅读:2