Home

parallella触ろう #01

気付いたら前回から何か月たってんのよみたいになるけど、第一回はーじまーるよー(遅 前回のおさらい Hello worldのサンプルを読みました しかしこれ気になるところが数点あるので、まずは気になるところをどうにかしてい […]

動き予測(おまけ)

さすがに20倍にはならないので、と書きましたが、よく考えたら、最近のx86 では サイクルあたりで 16byte の sad が一個取れるので、20倍ぐらい出そうな気がしたので試してみました。 https://bitbu […]

その他の時間計測方法

rdtscp や CPU_CLK_UNHALTED は、細かい性能を計測する場合には便利ですが、大きな粒度で計測したい場合、単位の変換などが面倒です。状況に応じて、色々な方法を使い分けると良いでしょう。 以下、思い付く範 […]

CPU_CLK_UNHALTEDの値を取得する

近年のCPUは電力削減のために、負荷にあわせてクロックが変動するものが多くなっています。 rdtsc, rdtscp で取得できる値は、このクロックとは別にカウントされており、省電力機能の有無に関わらず、一定クロックでカ […]

rdtscp を使う

x86マシンでは、処理時間を計測する時、rdtsc 命令を使うと便利な場合があります。 しかし、rdtsc で取得できるタイムスタンプ値は、コア毎に同期されておらず、マザーボードやBIOSによっては、大きな差が出ることが […]

parallella触ろう #00

ついに、ポータブルスーパーコンピュータと呼ばれて久しいParallellaが 国内でも容易に入手可能になりました。 Parallellaって何?って方は、PC Watchさんの記事をご覧いただければ http://pc. […]

Recent Comments

Social Media