Core Microarchitecture (Core MA)

電力効率の改善

クロック周波数を上げることによるパフォーマンス向上は、消費電力を急速に上げてしまうことより電力効率の悪さが大きな問題点として指摘されていました。

Core Microarchitecture は、1 Clock で処理できる命令数(IPC*1)を増やすことで、少ないクロック周波数でも多くの処理をこなせるよう改善されています。単に IPC を高める場合、演算回路を複雑にしてしまい結果として消費電力を上げてしまう可能性もあり、IPC とクロック周波数のバランスが重要だとしています。

【IDF】米Intel,マイクロアーキテクチャをCoreに全面移行:ITpro の記事に拠ると1 命令実行当たりの発熱量は以下のように推移しているとのこと。

  • Pentium ('93) - 10強nJ*2/命令
  • Pentium Pro ('95) - 20強nJ/命令
  • Pentium 4 ('01) - 約40nJ/命令
  • Pentium 4? ('05) - 約50nJ/命令
  • Core Duo ('06) - 約10nJ/命令

機能の改良

  • Intel Wide Dynamic Execution
    1 Clock で処理できる命令数を増やすことで性能を向上させています。
    • Micro-fusion
    • Macro-fusion
  • Intel Advanced Digital Media Boost
    マルチメディア系の命令(SSE/SSE2/浮動小数点演算)を更に向上させています。Yonah で実装された「Digital Media Boost」の強化版という位置付けです。
    • 128bitの浮動小数点演算(加算または乗算)が1クロックで実行可能?
    • 128bit SSE 命令を1サイクルで実行可能?
  • Intel Advanced Smart Cache
    複数の core が各々に L2 cache を持つ従来の方法ではなく、L2 cache を共用することで効率よく使用する機能です。従来の方法では core 同士の cache 制御を FSB を介して行うので、FSB がネックになり時間が掛かってします。Advanced Smart Cache では L2 cache を共用することより、FSB を介することなくデータを取得することが可能になっています。
    #若干 Athlon 64 に近づきましたね。
  • Intel Intelligent Power Capability
  • Intel Smart Memory Access
    メモリアクセスの効率化を行うことで性能を向上させています。
    • Memory Disambiguation
    • Advanced Pre-fetch

Core Microarchitecture は 64-bit が苦手?

「後藤弘茂のWeekly海外ニュース」によると Core Microarchitecture は 32-bit ではかなりのパフォーマンスを叩き出すようですが、反面 64-bit 環境下では 32-bit と比べるとパフォーマンスが落ちるという指摘がありました。これは CPU アーキテクチャが半ば固まった状況で 64-bit 拡張を取り込んだからではないかと指摘されています。

64-bit 環境でパフォーマンスが落ちる原因として「Macro-Fusion」が無効であること、「REX」プリフィックスを用いるとプリデコードの効率が落ちる可能性が挙げられています。

関連情報

用語

特集記事

後藤弘茂のWeekly海外ニュース

Core MA 年表

News

IDF 2006 Spring での発表 (06.03.06)



*1 Instruction Per Cycle
*2 ナノジュール。ジュールは熱量の単位

Last-modified: 2007.06.24 (日) 12:51:04 (4410d)