このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。
本日、フィックスターズは、CuPyをOpenCLでも使えるようにした「ClPy」のベータ版であるv2.1.0beta0を公開しました!
前回、6月にα版として先行リリースしたclpyは、今日からベータ版となり、アルファ版では不十分だった多くの機能を拡充しました。
具体的には、以下のような機能が追加されました。
今回、これらの機能(特に2つ目と3つ目)のために、LLVM/Clang(libTooling)を用いて、「生成元になるC++のソースコードを抽象構文木(AST)経由で意味解析をしてから適切な変換を施す」という技術を用いています。これについては、ここで解説すると長くなりますので、近い内に詳細を解説する記事を執筆し紹介したいと思います。
その他より詳細な変更点についてはGitHubのissue一覧をご覧ください。
ImageNetサンプルも動くようになったのが今回のベータ版での大きな目玉機能なのですが、性能測定結果を見ると分かる通り、同じGPUで比較してもCuPyに比べClPyはまだまだ遅い状態となっていることが分かります。この理由は複数あると私たちは考えていますが、一番の問題はcuBLAS/cuDNNに匹敵するOpenCLライブラリがないことで、これに関しては現在作業をしています。次回のリリースではもう少し性能が良くなったClPyになる予定です。
その他、現在作業中の内容は随時GitHubにて更新していきます。みなさんが使ってみた結果、うまく動かなかったりで支援が必要でしたり、こうした方が良いと思うなどの提案があれば、GitHubにIssueを遠慮なく作ってください(何語でも歓迎ですが、日本語か英語が推奨です)。
コンピュータビジョンセミナーvol.2 開催のお知らせ - ニュース一覧 - 株式会社フィックスターズ in Realizing Self-Driving Cars with General-Purpose Processors 日本語版
[…] バージョンアップに伴い、オンラインセミナーを開催します。 本セミナーでは、...
【Docker】NVIDIA SDK Managerでエラー無く環境構築する【Jetson】 | マサキノート in NVIDIA SDK Manager on Dockerで快適なJetsonライフ
[…] 参考:https://proc-cpuinfo.fixstars.com/2019/06/nvidia-sdk-manager-on-docker/ […]...
Windowsカーネルドライバを自作してWinDbgで解析してみる① - かえるのほんだな in Windowsデバイスドライバの基本動作を確認する (1)
[…] 参考:Windowsデバイスドライバの基本動作を確認する (1) - Fixstars Tech Blog /proc/cpuinfo ...
2021年版G検定チートシート | エビワークス in ニューラルネットの共通フォーマット対決! NNEF vs ONNX
[…] ONNX(オニキス):Open Neural Network Exchange formatフレームワーク間のモデル変換ツー...
YOSHIFUJI Naoki in CUDAデバイスメモリもスマートポインタで管理したい
ありがとうございます。別に型にこだわる必要がないので、ユニバーサル参照を受けるよ...