こんにちわ。
今更ですが、wildcat搭載機でのVoodooBanshee使用時の
L2キャッシュの重要性について考えてみました。(計測と経験から)
以前、G8VWVのM/BにK6-2とVoodooBansheeを搭載して使用していました。
そのときには、80MHz化していて、2ndキャッシュを搭載した場合、
必ず途中で固まり、SuperPAIがエラーになる現象が発生したため、
キャッシュを外して運用していました。
このとき、固まる前に取ったL2ありベンチとL2なしベンチを比べると、
かなりの速度低下が見られました。(通常運用時の体感速度も遅い)
Bansheeの前に使用していたPermedia2では、
ここまでの速度低下は発生しませんでした。
ここから考察されることは、
Bansheeは何らかの処理の一部(描画やデータ転送)のCPUへの依存度が、
Permedia2より高いのではないか、ということです。
そのため、PCIバスを介してVideoカードとCPU間で
データのやりとりを行うことが多いため、
wildcatのメモリ転送能力では処理しきれないのではないでしょうか。
この考えを証明してくれたのは、K6-IIIでした。
K6-IIIのL2キャッシュはCPUに内蔵されており、CPU速度に同期してアクセスが行われます。
このアクセスの高速さは、私のページ(http://www.remus.dti.ne.jp/~choge/)の
評価堂のコーナー内cmbenchの結果で確かめることが出来ます。
(480MHzのデータまで掲載)
L2が高速になったことにより、
wildcatの低いデータ転送能力が補われ、
Bansheeが本来の性能を発揮するようになりました。
ライトコンバインもその仕掛け上、wildcatの性能を補う手助けになります。
たぶん、Permedia2の場合は、
BansheeほどK6-III搭載時の描画能力の向上がないと思います。
(Permedia2搭載の方、フォロー願います。)
長々とすいませんでした。
間違っていたら指摘願います。
- re: 相模原のおやじ さん
投稿日:1999年06月05日(土) 19時19分49秒
相模原のおやじです。下記WildCatマシンで、CPUの違い・ライトアロケートの有無
(softhouse333さんのもの)・L2(L3)cacheの有無によるベンチの違いをとりました
ので報告します。Voodoo Bansheeは、CPUをグレードアップするとそれに見合った能
力を発揮してくれます。(キャッシュもコントローラも効きます。)
マシン:PC-9821Xt13/K12
メモリ:144MB
HDD:IDE:4GB(ウェスタン・デジタルWDAC-34000 ?)弱点です
Graphic: I-O GA-VDB16/PCI(1024×768:16bit)
HDBENCH: Ver.2.420
水準1:K6-III(400MHz)+ライトアロケート+L3cache(512KB)
水準2:K6-III(400MHz)+ライトアロケート なし
水準3:K6-III(400MHz) なし なし
水準4:K6-2 (333MHz) なし +L2cache(512KB)
all 浮 整 矩 円 テ ス DD R W cache
水準1:24474 24492 30669 79231 13174 31249 519 60 3010 2835 35086
水準2:22541 24457 30624 73352 12905 29891 519 60 2334 2817 25973
水準3:19542 24451 30620 63390 7789 19257 519 59 2360 2815 24690
水準4:15169 20326 25458 38347 6814 16479 519 59 2308 2746 23529
- re: 相模原のおやじ さん
投稿日:1999年06月05日(土) 19時44分25秒
ごめんなさい。OSを記入し忘れました。Windows98(95に上書き)です。
- re: BlueCat さん
投稿日:1999年06月05日(土) 21時10分15秒
>CPUへの依存度
まずHDBENCHでの比較は適切ではありません。
それはHDBENCHというベンチマークソフトがCPUの能力によりVideoの項目が左右されやすいからです。
I-ODATA&DOS/V雑誌によればBansheeはCPUによっての能力があまり変わらず、変わるのはRIVATNT系のGAです。
(そのためTNTの場合、遅いCPUだとあまり能力を発揮してくれません。)
DOS/V雑誌(&Oh!PC98年12月号にも載っています)などを見ると、解るかと思います。
(PenII-266でもPenII-400でもVoodoo2の速度は上がる傾向にありますが、Bansheeはほとんど誤差という感じにしかなっていません。)
以前提示しましたが、
RvII26(PenII-300)とXa13/W(K6-2 366)のHDBENCHでの差ははっきり言って矩形が1万以上、その他の項目も多少なりとも、RvII26の方が上でしたが、
Gabenchで比較してみるとほぼ同じという結果になります。
- re: 相模原のおやじ さん
投稿日:1999年06月05日(土) 22時13分17秒
BlueCatさん
貴重なアドバイス有り難うございます。確認したいのですが、CHOGEさんのおっしゃっている、cacheの影響いかがででしょうか。体感的には確かにL3cacheの有無は、明確にはわかっていません。
- re: ファイナル さん
投稿日:1999年06月05日(土) 23時37分15秒
体感的にはL3キャッシュでの差は判りません。
WinBench98 CPUの32ビット整数演算実力向上を見るV20Mの山猫で・・
CPUmark32 では差が出ました。
AMDK6-III/400 、 951
AMDK6-III/400L3ナシ、 785
スーパーπは104万桁で差が出てきます。数十秒違います。
3D Processing CPUだけで座標計算しながら3D空間をリアルタイムで計測し求める
AMDK6-III/400 20.3
AMDK6-III/400L3ナシ、 20.3
ベンチプログラムでもこのぐらいですね。
ベース100である程度の大きいプログラム1MB~2MBでしたら、DOS/Vマザーで差が出るでしょうが、これも体感的にはどうでしょうか?
つまり処理時間で1秒と2秒は差が判ります。20秒と21秒では?0,1秒と0.05秒では?相対的な時間観念で変化認識レベルです。
- re: CHOGE さん
投稿日:1999年06月05日(土) 23時38分40秒
相模原のおやじ殿、BlueCat殿 ありがとうございます。
CHOGEの考えを述べてみます。
まず、HDBENCHでの比較はCPUに依存する、との考えはあっていると思います。
でも、クロック依存が大きいんですよね。
同一クロックの結果で比較してみます。すべて320MHzの1280x1024の16bitです。
ALL 浮 整 矩 円 Text Scroll DD Read Write Memory
K6-2 15941 19745 24412 38669 6949 16439 284 59 10534 10501 12085
K6-3 18587 19782 24464 53496 7457 17645 297 59 12517 13043 12680
これを見ると、外部L2有り < 内部L2 という結果になっています。
ちなみに、外部L2が無い場合は、矩形が25000程度だった記憶が有ります。
データが残念ながら、1024x768の8bitしかありませんでした。
Permedia2はここまで速度に差は出ませんでした。
よって、Bansheeの場合、L2キャッシュへの影響が高いと判断しました。
次に、BansheeがCPUへの依存度が低い件です。
これは”RIVATNT”と比較した場合はたしかにBlueCatさんのおっしゃる通りです。
でも、それはチップセットに充分なデータ転送能力がある場合の話のようです。
wildcatの場合、そんな転送速度が無いようです。
だからこそ、外部L2を装着しない場合、速度低下が著しく、
また、K6-3にCPUを交換したときに、
同一クロックでも描画が速くなるのではないかと予想します。
ボード上で処理がほとんど行われる(?)Permedia2は、
L2を取り去っても描画速度の低下が少なかったのではないでしょうか?
ま、これらはすべて予測で物を言っております。
でも、Benchに出てくる数字が大きくなっただけで喜ぶのではなく、
その裏に有る「なぜ数値が高くなったか」を考えることは楽しいですね。
私の中ではベンチマークの醍醐味です。
- re: HAZAN さん
投稿日:1999年06月06日(日) 04時04分17秒
どうも、はじめまして。
私も、PREMEDIA2からVoodooBansheeにGAを変更したのですが、
エイジ・オブ・エンパイアでの通信対戦での負荷が増した感じがします。
RIVATNTに比べればマシとはいえ、BansheeもPREMEDIA2と比べると
CPUへの依存度が高いのかもしれませんね。
- re: BlackBox さん
投稿日:1999年06月06日(日) 15時32分37秒
わざわざ書くほどのことではないと思うのですが(^^;;
K6-IIIは内蔵L2CacheをきることができるのでK6-IIIをK6-2相当にしたものの結果もあるとおもしろいかも