Author Archive

命令単位の時間を計測する (準備)

命令単位の時間をはかってみましょう。この場合は、命令のクロック単位で知りたいことが多いので、CPU_CLK_UNHALTEDの値を使ってみます。 http://proc-cpuinfo.fixstars.com/2014 […]

その他の時間計測方法

rdtscp や CPU_CLK_UNHALTED は、細かい性能を計測する場合には便利ですが、大きな粒度で計測したい場合、単位の変換などが面倒です。状況に応じて、色々な方法を使い分けると良いでしょう。 以下、思い付く範 […]

CPU_CLK_UNHALTEDの値を取得する

近年のCPUは電力削減のために、負荷にあわせてクロックが変動するものが多くなっています。 rdtsc, rdtscp で取得できる値は、このクロックとは別にカウントされており、省電力機能の有無に関わらず、一定クロックでカ […]

rdtscp を使う

x86マシンでは、処理時間を計測する時、rdtsc 命令を使うと便利な場合があります。 しかし、rdtsc で取得できるタイムスタンプ値は、コア毎に同期されておらず、マザーボードやBIOSによっては、大きな差が出ることが […]

KNC(XeonPhi) のmax

KNC の浮動小数の max を行うintrinsicsは単精度、倍精度それぞれ二種類あります。 _mm512_gmax_ps, _mm512_gmax_pd _mm512_max_ps _mm512_max_pd gm […]