全新DPX指令将动态编程速度提高40倍

 行业动态     |      2022-03-25 14:49:43    |      沥拓

  动态编程算法应用于医疗卫生、机器人、量子计算、数据科学等领域。

  今天在GTC上发布的NVIDIAHopperGPU架构使用了新的DPX指令,将动态编程速度提高了40倍。动态编程是一种应用于基因组学、量子计算、路线优化等领域的算法来解决问题的技术。

  DPX是NVIDIAH100GPU的内置指令集,可以帮助开发人员编写代码,提高多个行业动态编程算法的速度,加快疾病诊断、量子模拟、图形分析和路线优化的工作过程。

  什么是动态编程?

  动态编程是一种起源于20世纪50年代的热门技术,它通过递归和记忆来解决复杂的问题。

  递归是指将问题分解为简单的子问题,以节省时间和计算量。记忆负责存储这些子问题的答案,这些答案在解决主要问题时会多次重复使用。记忆可以提高效率,所以当主要问题需要这些答案时,不需要重新计算子问题。

  与NVIDIAmpere架构GPU相比,DPX指令将动态编程算法在NVIDIAH100GPU上的速度提高了7倍。在配备四个NVIDIAH100GPU的节点中,速度可以进一步提高。

  用例涵盖医疗卫生、机器人、量子计算、数据科学。

  动态编程通常用于许多优化、数据处理和组学算法。到目前为止,大多数开发人员已经在CPU或FPGA上运行了这些算法,而在DPX指令的帮助下,NVIDIAHopperGPU可以大大加速。

  Omics

  组学涵盖了基因组学(关注DNA)、蛋白质组学(关注蛋白质)和转录组学(关注RNA)等一系列生物领域。这些领域为依赖算法分析的关键工作提供了依据,如疾病研究和药物研发(可通过DPX指令加速)。

  例如,Smith-Waterman和Nedleman-Wunsch动态编程算法用于DNA序列比较、蛋白质分类和蛋白质折叠。这两种算法都使用评分来测量不同样本基因序列的比较。

  Smith-Waterman可以产生高度准确的结果,但与其他比较方法相比,它需要更多的计算资源和时间。当DPX指令用于携带四个NVIDIAH100GPU的节点时,科学家可以加速这个过程35倍,实现实时处理。其中,碱基识别和比较的速度与DNA测序相同。

  这种加速将有助于全球医院普及基因组分析,使科学家朝着为患者提供个性化医疗的方向发展。

  线路优化

  无论是在仓库等动态环境中行走的独立机器人,还是需要将数据传输到计算机网络中多个接收端的发送者,都需要为多个移动部件找到最佳路线,这一点非常重要。

  为了解决这一优化问题,开发人员使用Floyd-Warshall动态编程算法在地图或图形中所有成对目的地之间找到最短的距离。Floyd-Warshall与传统的双插槽CPU服务器相比,Floyd-Warshall将速度提高了40倍。

  结合NVIDIAcuOptAI物流软件,可用于工厂、自动驾驶汽车或抽象图形中的地图构建和线路算法的实时应用。