[
新規
] - [
ツリー
] - [
スレッド
] - [
未解決
] [
緊急
] [
優先
] - [
検索
] [
RSS
] - [
サクラTOP
]
「サクラ」交流掲示板
サクラの掲示板です。
→
書き込み(
#534
)を編集する:
名前
タイトル
本文
実は、今回、「AMD64」というもの、「超最適化コンパイラ」の存在があるんですよね。 >しかしインラインアセンブラを使いこなしてクロック効率の高いプログラムになります。 うちも昔はその類のプログラマーでした。perlになってもある意味そうでしたが・・ しかし、今では、gccですらかなりやばい最適化をしてくれるようで。。。 とりあえず、高速化をあげるとしたら、このような感じで考えると良いのかもしれません。 1.むやみなステップ数の増加防止より、モジュールのサイズ低減を優先する →ループを上手に使ってL2キャッシュにヒットしやすくする 2.コアモジュールは、CPU相応にして1本とする →例) x86 SSE1 DLL x86 SSE1 SSE2 DLL x86 SSE1 SSE2 CHORUS REVERB DLL x86 SSE1 SSE2 SSE3 CHORUS REVERB DLL x64 SSE2 SSE2 SSE3 CHORUS REVERB DLL x64 SSE2 SSE2 SSE3 SSE4.1 CHORUS REVERB DLL (INTEL) x64 SSE2 SSE2 SSE3 SSE4.1 SSE4.2 AVX CHORUS REVERB DLL (INTEL) x64 SSE2 SSE2 SSE3 SSE4a CHORUS REVERB DLL (AMD) x64 SSE2 SSE2 SSE3 SSE4.1 SSE4.2 AVX FMA3 CHORUS REVERB DLL (INTEL) x64 SSE2 SSE2 SSE3 SSE4a FMA4 CHORUS REVERB DLL (AMD) ※x64からx86のDLLが呼び出せないとかいうオチはなしね 普通に、起動専用のexeからexeを起動すれば、x86からx64でもなんでも起動するし このあたりのCPU判別と、詳細の計算ライブラリ(厳密にはマクロ)だけが アセンブラになればいいのかな・・とも感じられる →言い換えれば、DLL間の呼び出しも、オーバーヘッド 3.無論、AMD64はコアなレジスタ数が倍になっている。(幅も倍だが) それだから直接速度が倍になるわけではないが、有効活用する。 4.外部計算モジュールが実装できる余地を残しておく? おかしいな、音を鳴らすために「GPUの力」を借りるなんて・・・
優先度
低
中
高
緊急
状態
未処理
調査中
修正中
確認待ち
解決
---
アイデア
感想
告知
確認キー
👆お手数ですが、いたずら防止のために、「医者」の読み方をカタカナで記入してください。
編集キー
編集時に使うキーを入力(省略可能)
添付ファイル
🎁
ファイルを選択...
画像ファイル(最大300KB)を添付可能