宋晨明_个人页

个人头像照片 宋晨明
个人头像照片
62
0
0

个人介绍

暂无个人介绍

擅长的技术

  • Linux
  • 数据库
获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2024年10月

  • 10.18 14:18:13
    发表了文章 2024-10-18 14:18:13

    手把手教你使用YOLOV5训练自己的目标检测模型

    本教程由肆十二(dejahu)撰写,详细介绍了如何使用YOLOV5训练口罩检测模型,涵盖环境配置、数据标注、模型训练、评估与使用等环节,适合大作业及毕业设计参考。提供B站视频、CSDN博客及代码资源链接,便于学习实践。
  • 10.18 14:17:04
    发表了文章 2024-10-18 14:17:04

    【大作业-04】手把手教你构建垃圾分类系统-基于tensorflow2.3

    本文介绍了基于TensorFlow 2.3的垃圾分类系统,通过B站视频和博客详细讲解了系统的构建过程。系统使用了包含8万张图片、245个类别的数据集,训练了LeNet和MobileNet两个卷积神经网络模型,并通过PyQt5构建了图形化界面,用户上传图片后,系统能识别垃圾的具体种类。此外,还提供了模型和数据集的下载链接,方便读者复现实验。垃圾分类对于提高资源利用率、减少环境污染具有重要意义。
  • 10.18 14:14:43
    发表了文章 2024-10-18 14:14:43

    【大作业-03】手把手教你用tensorflow2.3训练自己的分类数据集

    本教程详细介绍了如何使用TensorFlow 2.3训练自定义图像分类数据集,涵盖数据集收集、整理、划分及模型训练与测试全过程。提供完整代码示例及图形界面应用开发指导,适合初学者快速上手。[教程链接](https://www.bilibili.com/video/BV1rX4y1A7N8/),配套视频更易理解。
  • 10.18 14:14:17
    发表了文章 2024-10-18 14:14:17

    【大作业-02】水果蔬菜识别系统-基于tensorflow2.3开发

    2021年6月18日,TensorFlow 2.3物体分类代码已修复并更新。本项目支持自定义数据集训练,包括基于CNN和Mobilenet的模型,后者准确率高达97%。提供了详细的CSDN教程、B站教学视频及数据集下载链接,帮助用户快速上手。项目还包括PyQt5构建的图形界面,方便用户上传图片进行果蔬识别。更多详情与代码可在Gitee获取。
  • 10.18 14:13:33
    发表了文章 2024-10-18 14:13:33

    使用MMDetection进行目标检测

    本文介绍了如何使用MMDetection进行目标检测。首先需按官方文档安装MMDetection,不熟悉的同学可参考提供的教程链接。安装完成后,只需准备模型配置文件、模型文件及待检测的图片或视频。示例代码展示了如何加载模型并进行图像检测,最后通过可视化展示检测结果,包括类别和置信度。
  • 10.18 14:12:52
    发表了文章 2024-10-18 14:12:52

    EM算法对人脸数据降维(机器学习作业06)

    本文介绍了使用EM算法对人脸数据进行降维的机器学习作业。首先通过加载ORL人脸数据库,然后分别应用SVD_PCA、MLE_PCA及EM_PCA三种方法实现数据降维,并输出降维后的数据形状。此作业展示了不同PCA变种在人脸数据处理中的应用效果。
  • 10.18 14:12:07
    发表了文章 2024-10-18 14:12:07

    机器学习第五次作业

    机器学习第五次作业包含三个题目。第一题实现高斯贝叶斯分类和高斯朴素贝叶斯分类,分别用于判断瓜的好坏。第二题使用EM算法对数据进行聚类,输出两个类别的均值、方差和先验概率。第三题内容未完整展示。
  • 10.18 14:08:37
    发表了文章 2024-10-18 14:08:37

    坐标下降求解人脸表示(机器学习作业04)

    这是机器学习第四次作业的解答,包含两道题目。第一题涉及数学推导,给出了详细的求解过程。第二题则通过 Python 代码实现图像处理,包括读取单张图片和批量读取文件夹中的图片,并将图像数据转换为矩阵形式。
  • 10.18 14:07:53
    发表了文章 2024-10-18 14:07:53

    PaddleOCR学习笔记 01-PaddleOCR简介

    《PaddleOCR学习笔记 01-PaddleOCR简介》涵盖了PaddleOCR的基础介绍、OCR技术概览、PaddleOCR的开源状态及主要算法,包括文字检测与识别算法、百度自研的SAST、SRN和End2End-PSL等,以及9m超轻量模型的介绍。适合初学者入门学习。
  • 10.18 14:07:07
    发表了文章 2024-10-18 14:07:07

    圆形检测算法-基于颜色和形状(opencv)

    该代码实现了一个圆检测算法,用于识别视频中的红色、白色和蓝色圆形。通过将图像从RGB转换为HSV颜色空间,并设置对应颜色的阈值范围,提取出目标颜色的区域。接着对这些区域进行轮廓提取和面积筛选,使用霍夫圆变换检测圆形,并在原图上绘制检测结果。
  • 10.18 14:06:25
    发表了文章 2024-10-18 14:06:25

    python利用pyqt5和opencv打开电脑摄像头并进行拍照

    本项目使用Python的PyQt5和OpenCV库实现了一个简单的摄像头应用。用户可以通过界面按钮打开或关闭摄像头,并实时预览视频流。点击“拍照”按钮可以捕捉当前画面并保存为图片文件。该应用适用于简单的图像采集和处理任务。
  • 10.18 14:04:36
    发表了文章 2024-10-18 14:04:36

    【大作业-01】花卉识别-基于tensorflow2.3实现

    2021年6月18日更新:提供修复后的TensorFlow 2.3物体分类代码,支持自定义数据集训练。包含CSDN教程、B站视频、数据集及代码下载链接。示例项目为花卉识别,涵盖模型训练、测试、保存和使用,附带图形界面操作指南。
  • 10.18 14:03:13
    发表了文章 2024-10-18 14:03:13

    如何使用服务器训练模型

    本文介绍了如何使用服务器训练模型,包括获取服务器、访问服务器、上传文件、配置环境、训练模型和下载模型等步骤。适合没有GPU或不熟悉Linux服务器的用户。通过MobaXterm工具连接服务器,使用Conda管理环境,确保训练过程顺利进行。
  • 10.18 14:02:10
    发表了文章 2024-10-18 14:02:10

    聊一聊计算机视觉中的高斯分布

    高斯分布,又称正态分布,是概率统计中常见的分布形式。在计算机视觉领域,高斯分布被广泛应用于图像噪声建模、高斯滤波、特征表示、背景建模及高斯核密度估计等方面,是许多图像处理算法的核心。通过高斯分布,可以有效处理噪声、平滑图像、提取特征及建模背景,提升算法性能。
  • 10.18 14:01:26
    发表了文章 2024-10-18 14:01:26

    聊一聊计算机视觉中的KL散度

    KL散度(Kullback-Leibler Divergence)是一种衡量两个概率分布差异的非对称度量,在计算机视觉中有广泛应用。本文介绍了KL散度的定义和通俗解释,并详细探讨了其在变分自编码器(VAE)、生成对抗网络(GAN)、知识蒸馏、图像分割、自监督学习和背景建模等领域的具体应用。通过最小化KL散度,这些模型能够更好地逼近真实分布,提升任务性能。
  • 10.18 14:00:36
    发表了文章 2024-10-18 14:00:36

    简单聊一聊大模型微调技术-LoRA

    LoRA(Low-Rank Adaptation)是一种用于减少大模型微调中参数数量和计算资源的技术。通过引入低秩分解,LoRA 仅更新少量参数,从而显著降低显存消耗和计算需求。适用于大规模预训练模型的微调、跨领域迁移学习、低资源设备部署和多任务学习等场景。例如,在微调 BERT 模型时,LoRA 可以仅调整约 0.1% 的参数,保持与全量微调相近的性能。
  • 10.18 14:00:00
    发表了文章 2024-10-18 14:00:00

    mmseg配置解析 Polynomial Decay 多项式衰减

    Polynomial Decay(多项式衰减)是一种常用的学习率调度方法,通过多项式函数逐步减少学习率,帮助模型更好地收敛。公式为:\[ lr = (lr_{initial} - \eta_{min}) \times \left(1 - \frac{current\_iter}{max\_iters}\right)^{power} + \eta_{min} \]。参数包括初始学习率、最小学习率、当前迭代次数、总迭代次数和衰减指数。适用于需要平滑降低学习率的场景,特别在训练后期微调模型参数。
  • 10.18 13:58:47
    发表了文章 2024-10-18 13:58:47

    mmseg配置解析 align_corners=False

    `align_corners=False` 是图像插值操作中的一个参数,影响输入和输出图像的角点对齐方式。`align_corners=True` 严格对齐角点,而 `align_corners=False` 均匀分布像素点,更适用于保持整体比例关系的任务,如语义分割。
  • 10.18 13:58:18
    发表了文章 2024-10-18 13:58:18

    mmseg配置解析 contract_dilation=True

    `contract_dilation=True` 是 ResNetV1c 中的一种设置,用于解决多层膨胀卷积中的“栅格效应”。通过调整膨胀率,使卷积核在不同阶段更密集地覆盖输入特征图,避免信息丢失,提升特征提取质量,尤其在语义分割任务中效果显著。
  • 10.18 13:57:44
    发表了文章 2024-10-18 13:57:44

    聊一聊计算机视觉中常用的注意力机制以及Pytorch代码实现

    本文介绍了几种常用的计算机视觉注意力机制及其PyTorch实现,包括SENet、CBAM、BAM、ECA-Net、SA-Net、Polarized Self-Attention、Spatial Group-wise Enhance和Coordinate Attention等,每种方法都附有详细的网络结构说明和实验结果分析。通过这些注意力机制的应用,可以有效提升模型在目标检测任务上的性能。此外,作者还提供了实验数据集的基本情况及baseline模型的选择与实验结果,方便读者理解和复现。
  • 10.18 13:56:49
    发表了文章 2024-10-18 13:56:49

    Gradio如何使用

    **Gradio** 是一个开源 Python 库,用于快速创建和部署机器学习模型的用户界面。它支持多种输入输出形式,如文本、图像、音频等,无需复杂 Web 开发知识即可实现模型的直观展示和交互。Gradio 特点包括简单易用、实时更新、多样的输入输出形式以及轻松部署。通过几个简单的步骤,即可创建和分享功能强大的机器学习应用。
  • 10.18 13:56:12
    发表了文章 2024-10-18 13:56:12

    为 NVIDIA Jetson 和其他嵌入式系统选择合适的摄像头

    本文详细介绍了为NVIDIA Jetson和其他嵌入式系统选择合适摄像头模块的关键因素,包括传感器类型(CCD和CMOS)、电子快门(全局快门和滚动快门)、彩色或单色传感器、动态范围、分辨率、帧率和接口等。文章还提供了光学器件的选择建议,并列出了NVIDIA摄像头模块合作伙伴,帮助用户完成从概念到生产的整个设计过程。
  • 10.18 13:55:30
    发表了文章 2024-10-18 13:55:30

    🐍 30 Days Of Python

    《30天Python挑战》是一个为期30天的编程挑战,旨在帮助初学者和专业人士掌握Python编程语言。每天涵盖不同的主题,从变量、内置函数到高级主题如API构建等,通过易懂的解释、实例和练习逐步深入。作者Asabeneh Yetayeh还提供了视频教程和社区支持,确保学习者能够顺利完成挑战并获得证书。项目包括环境搭建、基础语法、数据类型、控制结构等内容,适合所有水平的学习者。
  • 10.18 13:54:50
    发表了文章 2024-10-18 13:54:50

    图灵奖获得者杰夫·辛顿(Geoffrey Hinton)

    杰夫·辛顿(Geoffrey Hinton),加拿大-英国籍教育科研工作者,1947年生于英国温布尔登。他因在神经网络和深度学习领域的杰出贡献,于2018年获得图灵奖。辛顿是反向传播算法和对比散度算法的发明人之一,被誉为“AI教父”。他的研究推动了现代神经网络的发展,并在多个国际顶级期刊上发表了多篇重要论文。
  • 10.18 13:53:55
    发表了文章 2024-10-18 13:53:55

    【小样本图像分割-4】nnU-Net: Self-adapting Framework for U-Net-Based Medical Image Segmentation

    《nnU-Net: 自适应框架用于基于U-Net的医学图像分割》是一篇2018年的论文,发表在Nature上。该研究提出了一种自适应的医学图像分割框架nnU-Net,能够自动调整模型的超参数以适应不同的数据集。通过2D和3D U-Net及级联U-Net的组合,nnU-Net在10个医学分割数据集上取得了卓越的性能,无需手动调整。该方法强调数据增强、预处理和训练策略等技巧,为医学图像分割提供了一个强大的解决方案。
  • 10.18 13:53:18
    发表了文章 2024-10-18 13:53:18

    【Medical Images-1】医学图像中常见的数据格式

    医学图像中常见的数据格式包括DICOM、NifTI、TIFF等。DICOM是最常用的标准,用于存储和交换医学图像;NifTI主要用于神经影像学;TIFF则广泛应用于光栅图像的存储。其他常见格式还包括PAR/REC、ANALYZE、NRRD、MINC等。每种格式都有其特定的应用场景和优势。在实际应用中,应根据具体需求选择合适的格式。
  • 10.18 13:52:45
    发表了文章 2024-10-18 13:52:45

    使用 NVIDIA TAO Toolkit 5.0 体验最新的视觉 AI 模型开发工作流程

    NVIDIA TAO Toolkit 5.0 提供低代码框架,支持从新手到专家级别的用户快速开发视觉AI模型。新版本引入了开源架构、基于Transformer的预训练模型、AI辅助数据标注等功能,显著提升了模型开发效率和精度。TAO Toolkit 5.0 还支持多平台部署,包括GPU、CPU、MCU等,简化了模型训练和优化流程,适用于广泛的AI应用场景。
  • 10.18 13:51:41
    发表了文章 2024-10-18 13:51:41

    NVIDIA Ampere 架构的结构化稀疏功能及其在搜索引擎中的应用

    NVIDIA Ampere架构引入了结构化稀疏功能,显著加速了深度学习模型的推理过程。通过2:4的稀疏模式,即每4个相邻权重中有至少2个为0,实现了高效的内存访问和模型推理加速,同时保持了模型精度。腾讯机器学习平台部门利用这一特性,通过渐进式训练方法,实现了模型在搜索引擎中的高效部署与应用,如相关性预测、查询性能预测等场景,不仅提升了处理速度,还在某些情况下超过了原有模型的精度。此外,NVIDIA还提供了TensorRT和cuSPARSELt库,进一步增强了稀疏模型的推理效率。
  • 10.18 13:50:46
    发表了文章 2024-10-18 13:50:46

    【小样本图像分割-3】HyperSegNAS: Bridging One-Shot Neural Architecture Search with 3D Medical Image Segmentation using HyperNet

    本文介绍了一种名为HyperSegNAS的新方法,该方法结合了一次性神经架构搜索(NAS)与3D医学图像分割,旨在解决传统NAS方法在3D医学图像分割中计算成本高、搜索时间长的问题。HyperSegNAS通过引入HyperNet来优化超级网络的训练,能够在保持高性能的同时,快速找到适合不同计算约束条件的最优网络架构。该方法在医疗分割十项全能(MSD)挑战的多个任务中展现了卓越的性能,特别是在胰腺数据集上的表现尤为突出。
  • 10.18 13:49:58
    发表了文章 2024-10-18 13:49:58

    【小样本图像分割-2】UniverSeg: Universal Medical Image Segmentation

    UniverSeg是一种用于医学图像分割的小样本学习方法,通过大量医学图像数据集的训练,实现了对未见过的解剖结构和任务的泛化能力。该方法引入了CrossBlock机制,以支持集和查询集之间的特征交互为核心,显著提升了分割精度。实验结果显示,UniverSeg在多种任务上优于现有方法,特别是在任务多样性和支持集多样性方面表现出色。未来,该方法有望扩展到3D模型和多标签分割,进一步提高医学图像处理的灵活性和效率。
  • 10.18 13:49:02
    发表了文章 2024-10-18 13:49:02

    遥感语义分割数据集中的切图策略

    该脚本用于遥感图像的切图处理,支持大尺寸图像按指定大小和步长切割为多个小图,适用于语义分割任务的数据预处理。通过设置剪裁尺寸(cs)和步长(ss),可灵活调整输出图像的数量和大小。此外,脚本还支持标签图像的转换,便于后续模型训练使用。
  • 10.18 13:48:14
    发表了文章 2024-10-18 13:48:14

    【小样本图像分割-1】PANet: Few-Shot Image Semantic Segmentation with Prototype Alignment

    本文介绍了ICCV 2019的一篇关于小样本图像语义分割的论文《PANet: Few-Shot Image Semantic Segmentation With Prototype Alignment》。PANet通过度量学习方法,从支持集中的少量标注样本中学习类的原型表示,并通过非参数度量学习对查询图像进行分割。该方法在PASCAL-5i数据集上取得了显著的性能提升,1-shot和5-shot设置下的mIoU分别达到48.1%和55.7%。PANet还引入了原型对齐正则化,以提高模型的泛化能力。
  • 10.18 13:47:31
    发表了文章 2024-10-18 13:47:31

    NVIDIA Triton系列13-用 FasterTransformer 和 Triton 加速大型 Transformer 模型的推理

    本文介绍了 NVIDIA FasterTransformer 库及其在加速大型 Transformer 模型推理中的应用。FasterTransformer 是一个高效、可扩展的库,支持分布式多 GPU 推理,特别适合处理具有数万亿参数的模型。文章还详细讲解了如何使用 FasterTransformer 和 NVIDIA Triton 推理服务器优化 GPT-J 和 T5 模型的推理性能,包括张量并行、流水线并行等技术。
  • 10.18 13:46:44
    发表了文章 2024-10-18 13:46:44

    NVIDIA Triton系列12-模型与调度器2

    本文介绍了NVIDIA Triton服务器的“集成推理”功能,涵盖“集成模型”与“集成调度器”两部分,通过示例说明了如何构建一个包含图像预处理、分类和语义分割的推理流水线,强调了模型间数据张量的连接与处理,以及配置集成模型和调度器的具体步骤。
  • 10.18 13:45:35
    发表了文章 2024-10-18 13:45:35

    【CVDEBUG-1】- 页面文件太小,无法完成操作怎么办

    在执行深度学习任务时,尤其是YOLO训练过程中,可能会遇到“页面文件太小,无法完成操作”的错误。这通常是由于Windows内存分配不足导致的。解决方法包括清理C盘空间和调整虚拟内存大小。具体步骤为:1) 清理桌面、系统文件夹、回收站及浏览器缓存;2) 调整虚拟内存设置。操作后重启电脑即可解决问题。
  • 10.18 13:44:22
    发表了文章 2024-10-18 13:44:22

    NVIDIA Triton系列11-模型类别与调度器-1

    NVIDIA Triton推理服务器中,模型类别与调度器、批量处理器的搭配是管理机制的核心。本文介绍了无状态、有状态和集成模型,以及标准调度器和集成调度器,详细解释了有状态模型的控制输入和隐式状态管理,帮助理解 Triton 的复杂管理机制。
  • 10.18 13:43:34
    发表了文章 2024-10-18 13:43:34

    NVIDIA Triton系列10-模型并发执行

    NVIDIA Triton服务器支持模型并发执行,通过在单个或多个GPU上同时运行多个模型实例,提高计算资源利用率和性能。配置`instance_group`可调整每个模型的并发实例数,优化推理效率。此外,通过设置资源限制和优先级,确保在有限的计算资源下实现高效的任务调度。
  • 10.18 13:42:37
    发表了文章 2024-10-18 13:42:37

    CVPR2024 医学图像相关论文

    CVPR2024医学图像相关论文汇总,涵盖图像重建、超分、配准、分割、生成、分类、联邦学习、预训练模型、视觉-语言模型及计算病理等多个领域。包括多项创新技术,如QN-Mixer、PrPSeg、MAPSeg等,涉及多个开源项目和代码。持续更新中,欢迎关注。原始GIT地址:https://github.com/MedAIerHHL/CVPR-MIA
  • 10.18 13:41:47
    发表了文章 2024-10-18 13:41:47

    NVIDIA Triton系列09-为服务器添加模型

    本文介绍了如何为NVIDIA Triton模型仓库添加新模型。通过示例模型`inception_graphdef`的配置文件`config.pbtxt`,详细解释了模型名称、平台/后端名称、模型执行策略、最大批量值、输入输出节点及版本策略等配置项。内容涵盖了模型的基本要素和配置细节,帮助读者更好地理解和使用Triton服务器。
  • 10.18 13:38:58
    发表了文章 2024-10-18 13:38:58

    NVIDIA Triton系列08-用户端其他特性

    本文详细解析了NVIDIA Triton开源项目的image_client.py示例代码,涵盖指定通信协议(HTTP与gRPC)、调用异步模式与数据流处理、以及使用共享内存等核心功能,为开发者提供撰写Triton用户端应用的指导。通过具体代码示例,帮助读者理解如何高效利用Triton服务器进行模型推理。
  • 10.16 20:47:05
    发表了文章 2024-10-16 20:47:05

    NVIDIA Triton系列07-image_client 用户端参数

    本文详细介绍了NVIDIA Triton推理服务器的Python版image_client.py用户端参数,通过具体实例演示了如何使用这些参数与Triton服务器交互,包括指定服务器地址、选择模型、设置图像缩放方式、批量处理图片等关键操作,为初学者提供了实用的指导。实验环境搭建在Jetson AGX Orin和树莓派上,确保了内容的实践性和可操作性。
  • 10.16 20:46:20
    发表了文章 2024-10-16 20:46:20

    NVIDIA Triton系列06-安装用户端软件

    本文介绍了 NVIDIA Triton 推理服务器的用户端软件安装方法,包括源代码编译、可执行文件、Docker 容器和 Python 版用户端。重点讲解了 Python 用户端的安装和使用,通过示例展示了如何使用 `image_client` 工具进行图像分类推理请求。
  • 10.16 20:45:10
    发表了文章 2024-10-16 20:45:10

    NVIDIA Triton系列05-安装服务器软件

    本文介绍了NVIDIA Triton推理服务器的安装方法,涵盖源代码编译、可执行文件安装及Docker容器部署三种方式。重点讲解了在NVIDIA Jetson AGX Orin设备上的安装步骤,适合Ubuntu 18及以上系统。通过检查HTTP端口状态确认服务器运行正常,为后续客户端软件安装做准备。
  • 10.16 20:44:05
    发表了文章 2024-10-16 20:44:05

    NVIDIA Triton系列04-创建模型仓

    Triton推理模型仓库是NVIDIA Triton推理服务器的基础组件,用于组织和管理模型及其相关资源。本文介绍如何创建模型仓库,包括目录结构、文件内容及配置方法,适用于本地和云端环境。通过在NVIDIA Jetson AGX Orin平台上实践,帮助读者快速上手。
  • 10.16 20:38:01
    发表了文章 2024-10-16 20:38:01

    NVIDIA Triton系列03-开发资源说明

    NVIDIA Triton 推理服务器是用于高效部署机器学习模型的开源工具。本文介绍了初学者如何通过官方文档和 GitHub 开源仓库获取开发资源,包括快速启动指南、生产文档、示例和反馈渠道。特别强调了核心仓库中的六个重要部分,涵盖服务器部署、核心功能、后端支持、客户端接口、模型分析和模型导航工具。这些资源有助于初学者全面了解和掌握 Triton 项目。
  • 10.16 20:36:40
    发表了文章 2024-10-16 20:36:40

    NVIDIA Triton系列02-功能与架构简介

    本文介绍了NVIDIA Triton推理服务器的功能与架构,强调其不仅适用于大型服务类应用,还能广泛应用于各类推理场景。Triton支持多种模型格式、查询类型和部署方式,具备高效的模型管理和优化能力,确保高性能和系统稳定性。文章详细解析了Triton的主从架构,包括模型仓库、客户端应用、通信协议和推理服务器的核心功能模块。
  • 10.16 20:35:21
    发表了文章 2024-10-16 20:35:21

    NVIDIA Triton系列01-应用概论

    NVIDIA Triton推理服务器为AI服务类应用提供全面解决方案,支持多种处理器、框架及模型类型,优化部署与性能,适用于在线推荐、图像分类等场景。文中介绍了Triton在微软Teams、微信视觉应用及腾讯PCG在线推理中的成功案例,展示其在提升性能、降低成本方面的显著效果。
  • 10.16 20:34:12
    发表了文章 2024-10-16 20:34:12

    Nvidia TensorRT系列01-基本介绍

    NVIDIA TensorRT 是一个高性能的机器学习推理SDK,支持 TensorFlow、PyTorch 等框架。本文介绍了 TensorRT 的基本概念、安装指南、快速开始、案例和互补软件,如 NVIDIA Triton 推理服务器、DALI 和 TF-TRT。同时,文章还涵盖了 ONNX 支持、版本控制和弃用策略等内容。
  • 10.16 20:32:47
    发表了文章 2024-10-16 20:32:47

    Nvidia TensorRT系列01-TensorRT的功能1

    NVIDIA TensorRT是一个高性能深度学习推理优化器和运行时,支持C++和Python API。其编程模型分为构建阶段和运行时阶段,前者优化模型,后者执行推理。TensorRT支持多种数据类型和精度,包括FP32、FP16、INT8等,并提供插件机制以扩展支持的操作。
  • 10.16 20:30:06
    发表了文章 2024-10-16 20:30:06

    如何利用Python快捷地操作文件和文件夹

    关注B站用户“肆十二-”,观看更多实战教学视频。本文介绍Python的shutil库,涵盖文件和文件夹的复制、移动、删除及归档等高级操作,提供实用代码示例。
  • 发表了文章 2024-10-18

    手把手教你使用YOLOV5训练自己的目标检测模型

  • 发表了文章 2024-10-18

    【大作业-04】手把手教你构建垃圾分类系统-基于tensorflow2.3

  • 发表了文章 2024-10-18

    使用MMDetection进行目标检测

  • 发表了文章 2024-10-18

    【大作业-03】手把手教你用tensorflow2.3训练自己的分类数据集

  • 发表了文章 2024-10-18

    EM算法对人脸数据降维(机器学习作业06)

  • 发表了文章 2024-10-18

    【大作业-02】水果蔬菜识别系统-基于tensorflow2.3开发

  • 发表了文章 2024-10-18

    【CVDEBUG-1】- 页面文件太小,无法完成操作怎么办

  • 发表了文章 2024-10-18

    CVPR2024 医学图像相关论文

  • 发表了文章 2024-10-18

    【小样本图像分割-1】PANet: Few-Shot Image Semantic Segmentation with Prototype Alignment

  • 发表了文章 2024-10-18

    NVIDIA Triton系列11-模型类别与调度器-1

  • 发表了文章 2024-10-18

    NVIDIA Triton系列13-用 FasterTransformer 和 Triton 加速大型 Transformer 模型的推理

  • 发表了文章 2024-10-18

    如何使用服务器训练模型

  • 发表了文章 2024-10-18

    坐标下降求解人脸表示(机器学习作业04)

  • 发表了文章 2024-10-18

    聊一聊计算机视觉中的KL散度

  • 发表了文章 2024-10-18

    聊一聊计算机视觉中的高斯分布

  • 发表了文章 2024-10-18

    PaddleOCR学习笔记 01-PaddleOCR简介

  • 发表了文章 2024-10-18

    机器学习第五次作业

  • 发表了文章 2024-10-18

    mmseg配置解析 Polynomial Decay 多项式衰减

  • 发表了文章 2024-10-18

    遥感语义分割数据集中的切图策略

  • 发表了文章 2024-10-18

    【小样本图像分割-3】HyperSegNAS: Bridging One-Shot Neural Architecture Search with 3D Medical Image Segmentation using HyperNet

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息