英伟达深度学习SDK介绍

简介:

Abstract:
深度学习算法使用大量数据和GPU的计算能力直接从数据(如图像,信号和文本)中获取信息。NVIDIA DIGITS为图像分类提供了基于工作流的交互式解决方案。深度学习框架为设计和培训自定义深度神经网络提供了更大的灵活性,并提供了常用编程语言的接口。NVIDIA Deep Learning SDK为开发深度学习框架提供了强大的工具和库,如NVCaffe,Microsoft Cognitive Toolkit,TensorFlow,Theano,Torch等等。

1.介绍
NVIDIA Deep Learning SDK为设计和部署GPU加速深度学习应用程序提供了强大的工具和库。它包括用于深度学习原语,推理,视频分析,线性代数,稀疏矩阵和多GPU通信的库。
深度学习基元(CUDA ®深层神经网络库™(cuDNN) )
用于深度神经网络应用的高性能构件,包括卷积,激活函数和张量变换。
深度学习推理引擎(TensorRT™ )
面向生产部署的高性能深度学习推理运行时。
针对视频分析的深度学习(NVIDIA DeepStream™ SDK)
用于GPU加速转码和深度学习推理的高级C ++ API和运行时。
线性代数(CUDA ®基本线性代数子程序库™(CUBLAS) )
GPU加速的BLAS功能比单纯CPU的BLAS库性能提高6倍至17倍,
稀疏矩阵运算(NVIDIA CUDA ®稀疏矩阵库™(cuSPARSE) )
用于稀疏矩阵的GPU加速线性代数子程序,性能比CPU BLAS(MKL)高8倍,非常适合自然语言处理等应用。
多GPU通信(NVIDIA ®集体通信库™(NCCL) )
集体通信例程,例如全部采集,减少和广播,可在多达8个GPU上加速多GPU深度学习培训。
深学习SDK需要CUDA ®工具包™ ,它提供用于构建全新的GPU加速深学习算法,并显着提高现有应用程序的性能有全面的开发环境。
timg

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
机器学习/深度学习 人工智能 算法
英伟达工程师解读NeurIPS 2019最热趋势:贝叶斯深度学习、图神经网络、凸优化
2019年人工智能研究什么最热?从今年最大型的AI顶会NeurIPS可以发现几大趋势:科学家们开始探索深度学习背后的理论和原理,贝叶斯深度学习、图神经网络和凸优化等深度学习新方法成为最热趋势。
308 0
英伟达工程师解读NeurIPS 2019最热趋势:贝叶斯深度学习、图神经网络、凸优化
|
机器学习/深度学习 人工智能 自动驾驶
|
机器学习/深度学习 测试技术
震撼!英伟达用深度学习做图像修复,毫无ps痕迹
英伟达的研究人员发布了一种可以编辑图像或重建已损坏图像的深度学习方法,实现了一键P图,而且“毫无ps痕迹”。通过使用“部分卷积”层,该方法优于其他方法。
4538 0
|
机器学习/深度学习 人工智能 数据中心
【AI业界剧震】英伟达禁止数据中心使用GeForce做深度学习
英伟达最近悄然修改了用户许可协议(EULA),禁止在数据中心使用消费者级显卡GeForce做深度学习,这被认为是英伟达利用其市场主导地位,强推其高端处理器Tesla系列的举措,Tesla与GeForce架构类似,但价格是后者的十倍。
2177 0
下一篇
无影云桌面