Abstract:
深度学习算法使用大量数据和GPU的计算能力直接从数据(如图像,信号和文本)中获取信息。NVIDIA DIGITS为图像分类提供了基于工作流的交互式解决方案。深度学习框架为设计和培训自定义深度神经网络提供了更大的灵活性,并提供了常用编程语言的接口。NVIDIA Deep Learning SDK为开发深度学习框架提供了强大的工具和库,如NVCaffe,Microsoft Cognitive Toolkit,TensorFlow,Theano,Torch等等。
1.介绍
NVIDIA Deep Learning SDK为设计和部署GPU加速深度学习应用程序提供了强大的工具和库。它包括用于深度学习原语,推理,视频分析,线性代数,稀疏矩阵和多GPU通信的库。
深度学习基元(CUDA ®深层神经网络库™(cuDNN) )
用于深度神经网络应用的高性能构件,包括卷积,激活函数和张量变换。
深度学习推理引擎(TensorRT™ )
面向生产部署的高性能深度学习推理运行时。
针对视频分析的深度学习(NVIDIA DeepStream™ SDK)
用于GPU加速转码和深度学习推理的高级C ++ API和运行时。
线性代数(CUDA ®基本线性代数子程序库™(CUBLAS) )
GPU加速的BLAS功能比单纯CPU的BLAS库性能提高6倍至17倍,
稀疏矩阵运算(NVIDIA CUDA ®稀疏矩阵库™(cuSPARSE) )
用于稀疏矩阵的GPU加速线性代数子程序,性能比CPU BLAS(MKL)高8倍,非常适合自然语言处理等应用。
多GPU通信(NVIDIA ®集体通信库™(NCCL) )
集体通信例程,例如全部采集,减少和广播,可在多达8个GPU上加速多GPU深度学习培训。
深学习SDK需要CUDA ®工具包™ ,它提供用于构建全新的GPU加速深学习算法,并显着提高现有应用程序的性能有全面的开发环境。