【TensorRTやってみた】(1): TensorRT とは何か？

このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。

2018年3月13日 yasunori.endo

ソリューション事業部の遠藤です。

巷で話題のディープラーニングのモデルを動かすには、大きく分けて学習と推論の2つのフェーズがあります。実製品でディープラーニングを適用しようとした場合、基本的には2つのフェーズのうちの推論が動きます。したがって、推論の高速化はディープラーニングを適用するにあたって非常に重要なテーマです。

今回より4回にわたって、推論の高速化に効果のあるディープラーニング推論ライブラリの TensorRT を紹介します。

今回は第1回ということで、TensorRT の概要をまとめます。

TensorRT とは？

TensorRT は、NVIDIA製の高性能ディープラーニング推論最適化・実行ライブラリです。TensorRT を用いるとネットワークが最適化され、低レイテンシ・高スループットの推論を実現することができます。

TensorRT は具体的に、以下のような最適化・高速化をネットワークに対し適用します。

Layer & Tensor Fusion: Convolution:バイアス加算+ReLU などといった複数レイヤにまたがる処理を、をまとめて1レイヤで計算するように最適化
FP16 and INT8 Precision Calibration: FP32 に比べてモデルサイズとメモリ使用量の削減、および演算器の並列利用による高速化
Kernel Auto-Tuning: カーネルサイズ等に合わせてチューニングされたカーネルの利用による高速化
Dynamic Tensor Memory: メモリの利用を最適化
Multi Stream Execution: 複数のストリームで推論を並列に実行することで最適化

TensorRT で利用可能なレイヤ

TensorRT で利用可能なニューラルネットのレイヤは、以下のとおりです。一般的なニューラルネットに必要なレイヤは、一通りサポートされています。

activation (ReLU, tanh, sigmoid)
concatination
convolution / deconvolution
element wise
flatten
Fully Connected
LRN(正規化)
Padding
Plugin
Pooling (max & average)
scale
shuffle
softmax
squeeze
unary (exp, log, sqrt, recip, abs, neg)

TensorRT をサポートする環境

TensorRT の公式サイトによると、以下の環境がサポートされています。

Tesla (データセンタ向け)
Jetson シリーズ (組込み向け)
DRIVE シリーズ (車載向け)

GeForce は残念ながら公式にはサポートされていません。

以上で、TensorRT の紹介を終わります。次回は、TensorRT の導入方法について説明したいと思います。

About Author

yasunori.endo

Favorite Post

「OpenFOAMスレッド並列化のための基礎検討」を投稿＆発表してきました
2018年2月6日
FFmpeg API の使い方(1): デコードしてみる
2017年8月22日
ディリクレ過程混合モデルによるクラスタリングの振舞い方
2017年10月31日

Categories

Recent Comments

コンピュータビジョンセミナーvol.2 開催のお知らせ - ニュース一覧 - 株式会社フィックスターズ in Realizing Self-Driving Cars with General-Purpose Processors 日本語版

[…] バージョンアップに伴い、オンラインセミナーを開催します。本セミナーでは、�...
【Docker】NVIDIA SDK Managerでエラー無く環境構築する【Jetson】 | マサキノート in NVIDIA SDK Manager on Dockerで快適なJetsonライフ

[…] 参考：https://proc-cpuinfo.fixstars.com/2019/06/nvidia-sdk-manager-on-docker/ […]...
Windowsカーネルドライバを自作してWinDbgで解析してみる① - かえるのほんだな in Windowsデバイスドライバの基本動作を確認する (1)

[…] 参考：Windowsデバイスドライバの基本動作を確認する (1) - Fixstars Tech Blog /proc/cpuinfo ...
2021年版G検定チートシート | エビワークス in ニューラルネットの共通フォーマット対決！ NNEF vs ONNX

[…] ONNX（オニキス）：Open Neural Network Exchange formatフレームワーク間のモデル変換ツー�...
YOSHIFUJI Naoki in CUDAデバイスメモリもスマートポインタで管理したい

ありがとうございます。別に型にこだわる必要がないので、ユニバーサル参照を受けるよ...

フィックスターズは、”Speed up your Business” をコーポレートメッセージとして掲げるソフトウェアカンパニーです。マルチコアプロセッサを効率的に利用するためのソフトウェアの並列化および最適化と、省電力かつ高速IOを実現する新メモリ技術を活用したアプリケーションの高速化を通じて、医療、製造、金融、エンターテインメントなど、様々な分野のお客様のビジネスを加速し、グリーンITを実現しています。

【TensorRTやってみた】(1): TensorRT とは何か？

TensorRT とは？

TensorRT で利用可能なレイヤ

TensorRT をサポートする環境

Tags

About Author

yasunori.endo

Leave a Comment コメントをキャンセル

Tags

Favorite Post

Archives

Categories

コンピュータビジョンセミナーvol.2 開催のお知らせ - ニュース一覧 - 株式会社フィックスターズ in Realizing Self-Driving Cars with General-Purpose Processors 日本語版

【Docker】NVIDIA SDK Managerでエラー無く環境構築する【Jetson】 | マサキノート in NVIDIA SDK Manager on Dockerで快適なJetsonライフ

Windowsカーネルドライバを自作してWinDbgで解析してみる① - かえるのほんだな in Windowsデバイスドライバの基本動作を確認する (1)

2021年版G検定チートシート | エビワークス in ニューラルネットの共通フォーマット対決！ NNEF vs ONNX

YOSHIFUJI Naoki in CUDAデバイスメモリもスマートポインタで管理したい

Social Media