在全球疫情常态化的大背景下,数字经济蓬勃发展,预计到2024年,数字经济的发展将孕育出超过5亿个新应用/服务,加速着社会经济的数字化转型。
以证券行业为例,随着移动互联应用的常态化及行业数字化转型的加快,从电子化到互联网化,再到数智化,证券行业进入新机构时代,呈现出业务机构化、服务专业化等特征,市场竞争日益激烈,投资端资产多市场、全品种,交易模式也演化为多模式、多交易中心、数智辅助等模式。金融科技支撑的重要性日益凸显,逐渐成为券商卖方机构提升投研投资赋能、交易、中介、托管外包等服务的关键,甚至是胜负手因素。
“十四五”规划强调要发挥数字技术优势,营造良好的数字生态,兼具积极和稳健性,推动金融科技产业规范发展。打造一站式机构服务,提供一体化投研、交易、运营等服务,成为各大券商角力焦点。基于浪潮K1 Power的极速交易服务器,采用低延时网卡加速等创新技术,致力于辅助券商以更低的时延抢占期货等市场先机,提升客户体验,助力社会财富增值保值。
浪潮K1 Power采用RDMA IB网卡设备加速极限降低时延
证券市场行情瞬息万变,行情指标时效性极高,毫秒乃至微秒级别的行情数据差别都有可能导致资产的巨大差异,精确至毫秒级乃至微秒级的实时行情服务,能够为投资者投资决策争取更多的操作时间和空间。但从交易所快照行情数据到行情指标数据,背后需要海量的计算支撑。以十种K线、1.5万支证券、开市4小时、每3秒刷新行情数据为例,再加上实时、分时、市盈率、涨跌幅、委比、委差等十几项指标,计算量至少为10亿以上。由于限时开市开盘,开市开盘期间并发访问量是其他时段的几十倍,最大系统QPS最高达100万/秒。投资者订阅市场行情,后台服务主动推送行情更新的流量亦是海量级数据,以近100万并发用户,平均每用户订阅20支证券行情,每3秒刷新行情为例,行情最大推送流量约为700万/秒,经过合并及缓存优化,实际推送量也超过了200万/秒。
为满足期货投资者应对极端行情的投资需求,券商高频交易系统已经步入纳秒级交易时代,并实现了对多交易中心的全业务支持,对时延的需求愈发严苛,以满足投资者落地盘前抢单、通信链路加速等个性化的投资需求。
基于浪潮K1 Power的极速交易系统采用了超低延时的RDMA IB网卡设备加速,相比于传统的以太网卡,延时更低。传统以太网模式下,两台服务器之间传输数据时,须先把数据从应用缓存拷贝到Kernel中的TCP协议栈缓存,然后再拷贝到驱动层,最后拷贝到网卡缓存,多次内存拷贝需要CPU多次介入,导致处理延时高达数十微秒,整个过程中CPU过多参与也大量消耗了CPU性能,影响正常的数据计算。而在RDMA模式下,应用数据可以绕过Kernel协议栈而直接向网卡写数据,即网卡可以直接读取用户态的数据。由于浪潮K1 Power服务器支持PCIe Gen4,从而使得处理延时由数十微秒降低到1微秒内,且整个过程几乎不需要CPU参与,节省了性能。
浪潮K1 Power采用RDMA IB卡加速效果相比x86方案延时更低,实测数据显示,浪潮K1 Power搭配Gen4 RDMA IB卡,32字节延迟为0.80微秒,在1K字节时浪潮K1 Power/x86延迟比约为54%,即延时降低46%。浪潮K1 Power支持PCIe 4.0,又进一步降低了延时水平,在32K字节以下时,随着数据包增大,Gen4低延迟优势越明显,Gen4/Gen3延迟比最大约为85%;在512字节时,Gen4/Gen3延迟比约为92%。
为提高IB卡的易用性,浪潮商用机器封装了IB传输必须的建立连接和读写调用接口,用户无需了解IB API复杂的编程模型及细节,即可使用IB接口通信,体验IB RDMA的低延迟特性。
未来将集合处理器和CAPI特性优势系统延时有望进一步降低
浪潮K1 Power服务器搭载的全新POWER9处理器,相比x86服务器,在降低系统延时方面拥有诸多优势。多核多线程、CPU单核4线程的优势,能够轻松应对高并发状况,且主频高达3.8GHz,拥有更快的时钟周期;支持PCIe 4.0,将IO带宽提高了2倍,延时降低了1/2;高达110M的L3缓存,大幅提高了数据命中率;支持CAPI,将FPGA获取数据的延时降低至传统I/O架构的1/36。
根据未来发展规划,基于浪潮K1 Power的极速交易系统将探索基于CAPI的FPGA加速方案,在该方案中,CAPI将能够使异构设备使用虚拟地址直接访问系统内存。众所周知,NVLink技术使得CPU和GPU之间可以共享内存并可互相直接访问对方内存,从而极大地提高了CPU和GPU之间的协同工作效率,与此类似,CAPI作为FPGA和处理器的接口,将允许设备内存成为系统内存映射的一部分,从而使FPGA和CPU上运行的软件可以看到相同的虚拟内存地址,即内存共享。这些链路及带宽优势,结合数据传输路径上的优势,使得浪潮K1 Power的传输速率高而IO路径更短,从而使数据获取的延时降低至300纳秒级别。
传统的IO Flow需要驱动程序,需要内存搬移,需要从用户态切到内核态做设备驱动,要累计运行一万多条指令,而通过CAPI技术,一次IO Flow运行指令数量降低至500条以内,指令的大量精简进一步降低了延时。
数字经济时代,随着资本市场改革的加速,衍生品业务政策创新、新产品品种不断丰富,期货市场成交量和客户权益屡创新高,投资者结构和交易方式正在发生着结构性调整,机构化大势方兴未艾。快速增长的机构投资者对券商提出了更高要求,以极限降低时延为目标的极速交易系统为代表的金融科技迭代创新势在必行。基于浪潮K1 Power的低延时网卡方案,以更低的延时,结合浪潮K1 Power服务器高可靠、高安全及性能优势,将引领新一轮交易基础设施建设创新浪潮,加速行业数字化转型步伐。