Intel AVX-512IFMA52 命令セットによるモンゴメリ乗算の高速化

モンゴメリ乗算のプログラムを Intel AVX-512IFMA52 命令セットを用いて実装し、他の実装と比較しつつ、パフォーマンス分析を行い、効果を確かめます。結果的には AVX-512IFMA52 命令セットを用いない SIMD 実装に対して 85% の高速化を達成しました。
このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。
モンゴメリ乗算のプログラムを Intel AVX-512IFMA52 命令セットを用いて実装し、他の実装と比較しつつ、パフォーマンス分析を行い、効果を確かめます。結果的には AVX-512IFMA52 命令セットを用いない SIMD 実装に対して 85% の高速化を達成しました。
生産計画未経験者がFixstars Amplify Scheduling Engineを使って、半導体製造工程における仮想のテスト計画のスケジューリング最適化を試みました。
Fixstars Amplify Scheduling Engineは、Fixstars Amplify SDKから利用することができます。以下はSDKを用いたプログラム例です。
SfMなどで用いられる、2値特徴記述アルゴリズムであるHashSIFTの概要とCUDAによる高速化手法について紹介します。
今回はVisual SLAMやSfM(Structure from Motion)で行われる局所特徴量計算について、CUDAによる高速化に取り組んだ話を紹介します。
また、そのソースコードをcuda-efficient-featuresという名前でGitHubに公開しています。
2020年記事「シミュレーテッド分岐マシン(SBM)で巡回セールスマン問題を解く」 を題材にして、アップグレードした量子インスパイアード最適化ソリューション「Toshiba SQBM+」の新機能である、AUTOISINGソルバについてご紹介します。
東芝デジタルソリューションズ提供のシミュレーテッド分岐マシン(SBM)は、それを核とする量子インスパイアード最適化ソリューション「Toshiba SQBM+」と名称を改めて現在提供されています。
これから2回に分けて、この新しい SQBM+の機能をご紹介します。
フィックスターズでは、耐量子の公開鍵暗号である CRYSTALS-KYBER の高速な実装に取り組んでいます。今回は導入編として、CRYSTALS-KYBERの数理的な背景と公開鍵暗号の安全性の考え方について簡単に説明します。
teb_local_planner のアルゴリズムの概要を理解し、パラメータ調整ができるようになることを目的として解説します。
2022年12月に開催された Kaggle コンテスト「 Santa 2022 – The Christmas Card Conundrum 」の概要と解法について紹介します。
単一ソースで計算をGPU上で実行できる規格SYCLの実装のうち、活発に開発されているものを実際にインストールし、同じ計算コードで得られる性能を比較しました。
2022年7月から10月にかけて開催されたKaggleコンペティション DFL – Bundesliga Data Shootout に弊社エンジニア3名のチームで参加し、530チーム中6位の成績を収めました。
この結果弊社チームに金メダルが与えられ、2名がKaggle Competitions Masterの称号を獲得しました。
本投稿ではコンペの概要と解法について紹介します。
Livox社から新たに3D LiDAR「Mid-360」が発売されました。この記事では、Mid-360のROS1/ROS2での動かし方について紹介します。
rosbag2_storage_mcapパッケージが追加され、rosbag2のストレージとしてMCAPが選択できるようになりました。この記事ではrosbag2_storage_mcapの使い方を紹介します。
この記事はC++ Advent Calendar 2022の9日目の記事です。 皆さまこんにちは。今日もソフトウェア高速化してますか? 私も相変わらず色々と高速化している日々ですが、最近、私が書いたループ展開のコードを見 […]
はじめに こんにちは、Fixstars Autonomous Technologiesの鈴木です。 自動運転やロボットなどの分野でSLAMと呼ばれる技術があります。SLAMとは「Simultaneous Localiza […]
来る12月2日、ビジョン技術の実利用ワークショップ(ViEW2021)にて、『画像の次元削減のための高速共分散行列計算における近似誤差解析手法の提案』というタイトルで論文発表を行います。 日時2021年12月2日(木)1 […]
概要 Fixstars Autonomous Technologiesの重岡です。2021/4-5月に実施されたKaggleのコンペティション(BirdCLEF2021)に参加して、銀メダル(816チーム中37 […]
2021/9/2(木)にオンラインで開催されている日本ソフトウェア科学会第38回大会(JSSST2021)にて、東京大学の佐藤重幸先生とフィックスターズは共著で以下のポスター発表をします。 発表題 近似計算における精度低 […]
TL;DR: Issue, PR ソリューション第二事業部の今泉です。 先日東京大学の松井先生と共同でFacebook AI Research(以下FAIR)が公開している近似最近傍探索ライブラリFaissの4bit P […]
1ヶ月ほど前になりますが、東京大学 次世代知能科学研究センター主催のセミナーにおいて、『ARM CPUにおけるSIMDを用いた高速計算入門』と題して講演を行いました。 以下にセミナーの概要を転載します。 そしてこの度、こ […]
keisuke.kimura in Livox Mid-360をROS1/ROS2で動かしてみた
Sorry for the delay in replying. I have done SLAM (FAST_LIO) with Livox MID360, but for various reasons I have not be...
Miya in ウエハースケールエンジン向けSimulated Annealingを複数タイルによる並列化で実装しました
作成されたプロファイラがとても良さそうです :) ぜひ詳細を書いていただきたいです!...
Deivaprakash in Livox Mid-360をROS1/ROS2で動かしてみた
Hey guys myself deiva from India currently i am working in this Livox MID360 and eager to knwo whether you have done the...
岩崎システム設計 岩崎 満 in Alveo U50で10G Ethernetを試してみる
仕事の都合で、検索を行い、御社サイトにたどりつきました。 内容は大変参考になりま...
Prabuddhi Wariyapperuma in Livox Mid-360をROS1/ROS2で動かしてみた
This issue was sorted....