[436]  K6-IIIと本体L2キャッシュ。
投稿者:タロ さん   2000-01-18 00:24:17
こんにちは。
友人がNiftyの会議室にて、Xa7等の山猫マシンにK6-IIIを載せた場合、マシン本体のL2キャッシュは外した方が良いとの情報を得たそうなのですが、これって本当なのでしょうか。
私が聞いた内容を要約しますと以下のようになります。

1.本体L2があると、メモリ・アクセスが遅くなる。
2.両方のキャッシュにアクセスがあるので無駄が多い(512KBの本体L2なら良い)。
3.両L2に収まってしまうような小さいベンチマーク(CPUmark等)では本体L2があった方が結果は良くなるが、通常のソフトまたはpfm等のメモリ・アクセス速度を測るベンチでは逆の結果となる。
4.発熱等により本体L2がトラブルの元となる可能性が高い。

私自身はXa7にK6-IIIを載せ、256KBのマシン本体L2キャッシュも付けて使用しておりますが、何やら最近不安定なのでちょっと気になっています。ご教示いただければ幸いです。
  1. まりも さん   2000-01-18 02:24:19
     ですから…何度もいいますが256KBでは載せておく意味がありません。外してしまったほうが有利なことが多く、また安定動作にもつながります。
  2. 腐り鮪鯖男 さん   2000-01-18 10:08:05
    便乗質問です
    FNECHARD MES7 の06955から始まるツリーをみると動作させるアプリによってはL3の意味があるようにとれるのですが?
    うちのXVの512KBも外した方がいいのかな???
    分からなくなってきました
  3. まりも さん   2000-01-18 12:07:06
     データがないと納得しない人もいらしゃると思うので…。pfm686によるメモリアクセスの結果です。main read の違いに着目します。K6でW.A.が有効の場合は、main writeもreadに合わせて変化します。上の段が外部「L3」キャッシュを外すか無効にした場合です。430VXチップセット機でDIMMの場合、格段にメモリアクセスすが向上します。SIMMの場合は掲げませんが、ほとんど変化なしでした。
    【430VX】G8YVZマザーボード(V16/SP5)
    -- pfm686 ver2.1A DysanKeihin & (koji) --
    for PC-98*1 version 1.0A by vinwa
    L1 cache size 32KB
    L2 cache size 256KB (K6-III internal only)
    ------------------------------------------
    |MMX: ??? [AuthenticAMD Fam5 Mdl9 Stp 1]|
    |----------------------------------------|
    | 366.07[MHz] | [ns/dword] |[CPUclocks]|
    |---------------+------------+-----------|
    | E-cache read | 3.291 | 1.205 |
    | E-cache write | 4.780 | 1.750 |
    | main read | 18.028 | 6.599 |
    | main write | 40.152 | 14.699 |
    ------------------------------------------
    L2 cache size 256KB ( External L3 cache)
    |---------------+------------+-----------|
    | E-cache read | 3.291 | 1.205 |
    | E-cache write | 4.780 | 1.750 |
    | main read | 22.915 | 8.389 |
    | main write | 45.951 | 16.821 |
    ------------------------------------------
    430HX機の場合は、Intelsat 58 D5という、外部キャッシュがあると成り立たない設定ができます。これにより、わずかながらですが、メモリアクセスが速くなります。下記は Xa13/W13にK6-III 400MHz(66MHz*6)の場合です。パフォーマンスの落ち具合は僅かですんで、既に512KBを入れている人は外さなくてもよいかもしれませんが、このタイプのキャッシュは接触がイマイチ不安定で…。
    | main read | 24.731 | 5.754 | PCI 58=D5 外部L3C撤去
    | main read | 25.676 | 5.974 | PCI 58=55 外部L3Cあり

    Wildcat機では、セカンドキャッシュを手放してしまったのでテストできませんが、以前調べた時には、外部キャッシュがあるとメインメモリアクセスが相当落ち込んだのを確認しています。どなたかテストしてみて下さい。
  4. らいおん丸 さん   2000-01-18 13:54:11
    >Wildcat機では、セカンドキャッシュを手放してしまったのでテストできませんが、以前調べた時には、外部キャッシュがあるとメインメモリアクセスが相当落ち込んだのを確認しています。どなたかテストしてみて下さい。
    確かmain writeがゲキ遅になりました。79ぐらいだったような・・・。
    あっ、Xv13/山猫 でpfm686外部L3(256KB)有 K6-III400です。
    私もpfm686ではヘコみましたがGAがgoodなので外部L3は有りのままです、というかはずすのがめんどくさい(^^;
  5. aya さん   2000-01-18 22:02:05
    WildCatでのデータをとってきました。

    http://w33.mtci.ne.jp/~dkikuchi/testres.txt

    それだけだと実情がわからないかな、と思って過負荷試験の結果もいれてあります。
    過負荷試験は、バックグラウンドで大きな負荷をかけた状態でFinalRealityを測定しています。
    FinalRealityを選んだのは、ベンチ自体が長くない(MP3データがループしないうちに終わる)のと、詳細が見やすいからです。
    これから色々考えるのも面白いかもしれません。
  6. ゆうゆう さん   2000-01-18 22:38:22
    ayaさん
    3Dfillrateの値が低すぎるのでは?しかも、過負荷試験の方が値が高い。
    >これから色々考えるのも面白いかもしれません
  7. まりも さん   2000-01-18 23:12:40
    画像メモリ転送など、PCIバスへの転送は、メインメモリの転送とはまったく別個です。従って、メインメモリからの読み出しが少ない描画であれば、L2キャッシュがあるかどうかはベンチマークには関わらない場合があります。むしろPCIの転送レートが問題です。
  8. aya さん   2000-01-18 23:32:42
    : 3Dfillrateの値が低すぎるのでは?しかも、過負荷試験の方が値が高い。

    VSYNC 待ってますし。
    Offの数字に見慣れすぎるとそうなっちゃいますね^^;
  9. FIAT124 さん   2000-01-19 02:28:56
    実用面ではあってもなくてもあまり変わらないと思いますが
    ★ ★ ★ HDBENCH Ver 2.610 ★ ★ ★
    使用機種 V200M7C(流星)
    Processor AMD K6 399.5MHz [AuthenticAMD family 5 model 9 step 1]
    解像度 1024x768 65536色(16Bit)
    Display [X]スタンダード ディスプレイ アダプタ (9821 シリーズ)
    Display GA-VDB16シリーズ (メモリ120 コア108) ドライバー1.20
    Memory 129,412Kbyte (DIMMのみ)
    OS Windows 95 4.0 (Build: 1111) B

    SCSI = MELCO Ultra SCSI IFC-USP-M (Ver1.01)

    A = GENERIC NEC FLOPPY DISK
    CDEF = SDAT_HD ST36530A Rev 8412
    G = SEAGATE ST52160N Rev 0285
    H = TEAC CD-ROM CD-532S Rev 1.0A

    L3(旧 L2)なし
    ALL 浮 整 矩 円 Text Scroll DD Read Write Memory Drive
    25913 24474 30649 76481 13973 35471 512 59 13526 12218 15652 C:10MB

    L3(旧 L2)あり
    26130 24497 30679 77580 13943 36014 512 60 13437 12381 15669 C:10MB

    L3(旧 L2)なし + K6MSR3.21
    30333 24479 30650 84008 24023 52159 512 59 13969 12864 15796 C:10MB

    L3(旧 L2)あり + K6MSR3.21
    31146 24494 30670 87792 24409 54139 512 60 13875 13281 15816 C:10MB
    まあ純国産ベンチだし悪口は・・・一杯あるけど

    左から 400MHz(L3なし)400MHz(L3あり)450MHz(L3なし)

    Super_PI 104万桁 (アローケート・オフ)
    ・ 7分31秒 7分35秒 7分5秒
    Super_PI 209万桁 (アローケート・オフ)
    ・・ 17分33秒 17分53秒 16分37秒
    付属のヘルプだと、HITAC S-3800/480 で πの100万桁の計算は5秒、3355万桁の計算については4分だそうで。x86系CPUだとこんなものなのかな、遅いね。

    CPUMARK99 (アローケート・オン 16MB空間解放)愚かなベンチだ(悪口爆発)
    ・・37.3 - 37.9 - 40.6

    FINAL REALITY(K6MSR3.21使用 VSYNCと同期を取らない サウンド無し)
    2D IMAGE 3.60 - 3.50 - 3.76
    3D PERFORMANCE 4.18 - 4.21 - 4.34
    BUS TRANSFER 3.34 - 3.44 - 3.37
    OVERALL 3.88 - 3.88 - 4.02
    オーバークロック耐久テスト用ベンチだな

    NCOMMINGベンチ 800x600、16BIT・・サウンドWSS[本体標準音源]VSYNCと同期を取らない
    平均  - 56 - 57 (48) - 60 (48) FPS

    ゲームは連続して行うのでキャシュの効果も考慮し連続で3回計測しましたが
    1フレームも差がでませんでした。

    クエイクIIベンチ(3.20)16BIT miniGL1.46 、K6MSR3.21使用、サウンドWAVESTAR
    3dfx OpenGL MODE
    640x480 - 42 - 43 (37) - 44 (38)
    800x600 - 35 - 35 (33) - 35 (33)
    1024x768 - 24 - 24 (24) - 24 (24)
    ちなむにminiGL1.46は3DNowに未対応・・しくしく。
    ゲームベンチはサウンド切るとフレーム数が飛躍的に上がるが音のないベンチは反則だよね。
    (音の無いゲームなんてプレイ出来るか)

    インテルメディアベンチ・・K6MSR3.21使用、サウンドWSS
    VIDEO - 451.91 - 452.33 - 477.30
    IMAGE PROCESSING - 1444.17 - 1427.11 - 1558.62
    3D GRAPHICS - 220.14 - 221.23 - 246.69
    AUDIOは不正な処理により計測不可。
    2回目の数値を使用。
    インテル製CPUに最適化されたベンチ。
    でも同クロックのアスロンの前についに敗北(笑)

    3DMARK99、800x600、 16BIT (MAXじゃないよ)
    3DMARK - 1858 - 1864 - 1946 (1813)
    CPU Geomelity Speed - 3791 - 3776 - 4126 (3669)
    Raslenizer Score - 988 - 989 - 994 (987)
    Game 1 Race - 33.6 - 33.8 - 35.5 (32.8) FPS
    Game 2 First Person - 28.3 - 28.3 - 29.3 (27.6) FPS
    Fill Rate - 89.3 - 89.4 - 89.8 (89.8) MTexels/s
    Fill Rate WithMulti Texturing - 90.2 - 90.3 - 90.6 (90.6) MTexels/s
    Texture Rendening Speed
    2MB - 179.7 - 180.4 - 181.4 (180.5)FPS
    4MB - 166.2 - 167.0 - 168.1 (165.3)FPS
    8MB - 125.7 - 126.1 - 127.4 (124.5)FPS
    ループさせるとオーバークロック耐久テスト用ベンチになる
    最新版3D MARK2000は3D NOW !/SSE T&L用ベンチか。
  10. まりも さん   2000-01-19 06:24:52
     V200/M7でセカンド(L3)キャッシュを「なし」にするのは、ハードウェア的に行いましたか?。その場合の、PCIホストブリッジ52hの値を知りたいのですが…。Intelsat 52 と打ったときの値です。
  11. FIAT124 さん   2000-01-19 11:54:48
    >V200/M7でセカンド(L3)キャッシュを「なし」にするのは、ハードウェア的に行いましたか?
    以前ここで紹介された方法の最新版を利用して430VXチップ付近の11E6の抵抗を11E5に付け替えたものです。(INTELSAT 52 41 で本体L2をオンにしています)
    値は覚えていません。
    #書き忘れていましたが上記の( )内の数値はライトコンバイン未設定です。
    #今は抵抗を元に戻してます。
  12. まりも さん   2000-01-19 12:53:32
     あぁ、元に戻してしまっているのですか…。52hをいじってキャッシュ可にするのは上手く行きますが、逆に不可にするのは結構大変なので(^^;、そのまんまでもよいのではないかと思いますが…。
  13. FUJI さん   2000-01-19 20:04:08
    はい、そのまんまにしているFUJIです。
    確かL2OFFはINTELSAT 52 01の設定だったと思います。
    しかし、無改造でこの設定で起動した試しが有りません。当たり前といえばそうなんですが・・・。
  14. タロ さん   2000-01-19 22:24:15
    皆様、ありがとうございます。
    なるほど、あまり気にしない方がよさそうですね(^^;)。安全策をとって、L3は外しておくことにいたします。ところで、Niftyのツリーの方もようやく見つけました(あちらの会議室見たのって久々^^;)。まりもさん、あちらでもこの件に関して随分と発言なさっているのですね。繰り返すようなことになってしまいましてスイマセンでした。
    ありがとうございました。
  15. FIAT124 さん   2000-01-19 23:09:57
    >そのまんまでもよいのではないかと思いますが…。
    青札タワーでは問題ないそうなんですが、何故かうちの流星タワーだとCD-Rのライティングが出来なくなる(EasyCDクリエイターはインストールもできない 、NERO(Ver3.0)/ NERO MP3は立ち上げると不正な処理で落ちる)ので元に戻しました。
    SONY CDRFS(パケットライト)は使えますけどね (^^;
    #USB-MPGを使用しているのでビデオCDが焼けないと困る。
    #450MHz(L3なし)動作はN3下駄使用。(L3オンには出来ない)
    ・・・流星タワーのL3と相性が悪いのだろう。
  16. yama さん   2000-01-19 23:32:54
    Address[52] Data[1H]
  17. yama さん   2000-01-19 23:45:05
    ↑すみません。誤送信してしまいました。
    INTELSAT 52と打つとこのように表示されます。
    多分、FUJIさんのおっしゃるのと同じ意味だと思います。
  18. まりも さん   2000-01-20 01:10:06
     Intelsatを単に使うだけでは、キャッシュを切った直後にメモリデータの不整合が起こって、ハングしてしまいますね。専用のツールが必要です。430VXはちょっとしつこいです(^^;。