TensorRT是Nvidia开发的用于加速模型推理的SDK
pytorch –> onnx –> tensorrt
一、 pytorch –> onnx

步骤
1. 加载pytorch模型
1 | import torchvision.models as models |
2. 保存onnx模型
1 | import torch |
二、onnx –> tensorrt engine
有两种转换方法:
- 使用 trtexec
- 使用 TensorRT API
这里我们使用第一种方法:
1 | trtexec --onnx=resnet50_onnx_model.onnx --saveEngine=resnet_engine.trt --explicitBatch |
这会把resnet50_onnx_model.onnx转换为resnet_engine.trt。