TensorRT实现EfficientDet推理加速(二)

2023-10-30 16:10

本文主要是介绍TensorRT实现EfficientDet推理加速(二),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、参考资料

为什么你比官方的运行速度快
全网第一SoTA成绩却朴实无华的pytorch版efficientdet
PyTorch转TensorRT流程
一文掌握Pytorch-onnx-tensorrt模型转换
onnx-tensorrt安装
ONNX前向inference调试

二、重要说明

  • 论文中介绍说EfficiendDet-D1(640)的infer速度为16ms,实际上测试没有那么快;需要跑一下 efficientdet官方仓库 代码,测试真实速度;
  • 在GTX 1650(4GB)显卡上,测试EfficientDet-D0(512),不包含后处理infer,tensorRT加速比可达10倍;包含后处理的infer,tensorRT加速比可达4倍;

三、存在的问题

  • BatchedNMS_TRT

    batchedNMSPlugin
    Code sample to add custom importer for BatchedNMS_TRT in builtin_op_importers.cpp
    How to use NMS with Pytorch model (that was converted to ONNX -> TensorRT) #795

    ERROR:EngineBuilder:Failed to load ONNX file: /home/yichao/Downloads/saved_model_onnx-1/model.onnx
    ERROR:EngineBuilder:In node 882 (parseGraph): UNSUPPORTED_NODE: No importer registered for op: BatchedNMS_TRT
    
    https://github.com/NVIDIA/TensorRT/blob/master/CHANGELOG.md
    https://github.com/NVIDIA/TensorRT/tree/master/plugin/batchedNMSPlugin错误原因:
    tensorRT 8.0.1之后的版本支持 EfficientNMS_TRT plugins插件解决办法:
    更换tensorRT 版本
    
  • EfficientNMS_TRT

    nmsPlugin
    EfficientNMS_TRT not working on jetson nano (TensorRT 8.0.1)

    ERROR:EngineBuilder:Failed to load ONNX file: /home/yichao/Downloads/saved_model_onnx-1/model.onnx
    ERROR:EngineBuilder:In node 853 (parseGraph): UNSUPPORTED_NODE: No importer registered for op: EfficientNMS_TRT
    
    错误原因:
    不兼容低于 tensorRT 8.0.1 版本的 plugins 插件,需要增加 --legacy_plugins 参数,增加兼容性。
    --legacy_plugins allows falling back to older plugins on systems where a version lower than TensorRT 8.0.1 is installed. This will result in substantially slower inference times however, but is provided for compatibility.解决办法:
    增加 --legacy_plugins 参数python create_onnx.py \--input_shape '1,512,512,3' \--saved_model /home/yichao/Downloads/efficientdet_d0_coco17_tpu-32/saved_model \--onnx /home/yichao/Downloads/saved_model_onnx-1/model.onnx \--legacy_plugins
    
  • 无法解析onnx模型

    ERROR:EngineBuilder:Failed to load ONNX file: /home/yichao/Downloads/saved_model_onnx/model.onnx
    ERROR:EngineBuilder:In node -1 (parseGraph): UNSUPPORTED_NODE: Assertion failed: convertOnnxWeights(initializer, &weights, ctx)
    
    错误原因:
    博主的onnx版本太新了,降低onnx版本即可,按照requirements.txt文件中的版本安装方法一:
    降低onnx版本,按照requirements.txt文件中的版本安装方法二:
    如果方法一无法解决,尝试方法二
    下载另外一种格式的预训练模型(1)AutoML Models
    (2)TFOD Models
    
  • build_engine.py生成引擎错误

    [TensorRT] ERROR: [graphShapeAnalyzer.cpp::throwIfError::1306] Error Code 9: Internal Error (fpn_cells/cell_0/fnode0/add_n/add: broadcast dimensions must be conformable
    )
    ERROR:EngineBuilder:Failed to load ONNX file: /media/yichao/蚁巢文件/YOYOFile/ModelZoo/EfficientDet模型/D7/saved_model_onnx/model.onnx
    ERROR:EngineBuilder:In node 681 (parseGraph): INVALID_NODE: Invalid Node - fpn_cells/cell_0/fnode0/add_n/add
    [graphShapeAnalyzer.cpp::throwIfError::1306] Error Code 9: Internal Error (fpn_cells/cell_0/fnode0/add_n/add: broadcast dimensions must be conformable
    )
    
    [TensorRT] ERROR: [graphShapeAnalyzer.cpp::throwIfError::1306] Error Code 9: Internal Error (mul_5: broadcast dimensions must be conformable
    )
    ERROR:EngineBuilder:Failed to load ONNX file: /media/yichao/蚁巢文件/YOYOFile/ModelZoo/EfficientDet模型/D7/saved_model_onnx/model.onnx
    ERROR:EngineBuilder:In node 1452 (parseGraph): INVALID_NODE: Invalid Node - mul_5
    [graphShapeAnalyzer.cpp::throwIfError::1306] Error Code 9: Internal Error (mul_5: broadcast dimensions must be conformable
    )
    
    错误原因:
    不同Model模型的input shape不同,解决办法:
    对于EfficientDet D0
    python create_onnx.py \--input_shape '1,512,512,3' \--saved_model /path/to/saved_model \--onnx /path/to/model.onnx对于EfficientDet D7
    python create_onnx.py \--input_shape '1,1536,1536,3' \--saved_model /path/to/saved_model \--onnx /path/to/model.onnx
    

在这里插入图片描述

这篇关于TensorRT实现EfficientDet推理加速(二)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:https://blog.csdn.net/m0_37605642/article/details/121450447
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/309089

相关文章

python实现svg图片转换为png和gif

《python实现svg图片转换为png和gif》这篇文章主要为大家详细介绍了python如何实现将svg图片格式转换为png和gif,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录python实现svg图片转换为png和gifpython实现图片格式之间的相互转换延展:基于Py

Python利用ElementTree实现快速解析XML文件

《Python利用ElementTree实现快速解析XML文件》ElementTree是Python标准库的一部分,而且是Python标准库中用于解析和操作XML数据的模块,下面小编就来和大家详细讲讲... 目录一、XML文件解析到底有多重要二、ElementTree快速入门1. 加载XML的两种方式2.

Java的栈与队列实现代码解析

《Java的栈与队列实现代码解析》栈是常见的线性数据结构,栈的特点是以先进后出的形式,后进先出,先进后出,分为栈底和栈顶,栈应用于内存的分配,表达式求值,存储临时的数据和方法的调用等,本文给大家介绍J... 目录栈的概念(Stack)栈的实现代码队列(Queue)模拟实现队列(双链表实现)循环队列(循环数组

C++如何通过Qt反射机制实现数据类序列化

《C++如何通过Qt反射机制实现数据类序列化》在C++工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作,所以本文就来聊聊C++如何通过Qt反射机制实现数据类序列化吧... 目录设计预期设计思路代码实现使用方法在 C++ 工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作。由于数据类

Python实现图片分割的多种方法总结

《Python实现图片分割的多种方法总结》图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,本文为大家整理了一些常用的分割方法,大家可以根据需求自行选择... 目录1. 基于传统图像处理的分割方法(1) 使用固定阈值分割图片(2) 自适应阈值分割(3) 使用图像边缘检测分割(4)

Android实现在线预览office文档的示例详解

《Android实现在线预览office文档的示例详解》在移动端展示在线Office文档(如Word、Excel、PPT)是一项常见需求,这篇文章为大家重点介绍了两种方案的实现方法,希望对大家有一定的... 目录一、项目概述二、相关技术知识三、实现思路3.1 方案一:WebView + Office Onl

C# foreach 循环中获取索引的实现方式

《C#foreach循环中获取索引的实现方式》:本文主要介绍C#foreach循环中获取索引的实现方式,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、手动维护索引变量二、LINQ Select + 元组解构三、扩展方法封装索引四、使用 for 循环替代

Spring Security+JWT如何实现前后端分离权限控制

《SpringSecurity+JWT如何实现前后端分离权限控制》本篇将手把手教你用SpringSecurity+JWT搭建一套完整的登录认证与权限控制体系,具有很好的参考价值,希望对大家... 目录Spring Security+JWT实现前后端分离权限控制实战一、为什么要用 JWT?二、JWT 基本结构

Java实现优雅日期处理的方案详解

《Java实现优雅日期处理的方案详解》在我们的日常工作中,需要经常处理各种格式,各种类似的的日期或者时间,下面我们就来看看如何使用java处理这样的日期问题吧,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言一、日期的坑1.1 日期格式化陷阱1.2 时区转换二、优雅方案的进阶之路2.1 线程安全重构2

Android实现两台手机屏幕共享和远程控制功能

《Android实现两台手机屏幕共享和远程控制功能》在远程协助、在线教学、技术支持等多种场景下,实时获得另一部移动设备的屏幕画面,并对其进行操作,具有极高的应用价值,本项目旨在实现两台Android手... 目录一、项目概述二、相关知识2.1 MediaProjection API2.2 Socket 网络