ワットあたりのパフォーマンス
コンピューティングでは、 ワットあたりのパフォーマンスは、特定のコンピューターアーキテクチャまたはコンピューターハードウェアのエネルギー効率の尺度です。文字通り、消費される電力のワットごとにコンピューターが提供できる計算速度を測定します。このレートは通常、コンピューティングシステム間で比較しようとするときのLINPACKベンチマークのパフォーマンスによって測定されます。
Googleのハードウェアなどの並列コンピューターを構築するシステム設計者は、CPUに電力を供給するコストがCPU自体のコストを上回るため、電力(W500を除く)ワットあたりのパフォーマンスに基づいてCPUを選択します。
定義
使用されるパフォーマンスと消費電力のメトリックは、定義によって異なります。パフォーマンスの合理的な尺度は、FLOPS、MIPS、またはパフォーマンスベンチマークのスコアです。メトリックの目的に応じて、電力使用量のいくつかの測定値を使用できます。たとえば、メトリックはマシンに直接供給される電力のみを考慮し、別のメトリックは冷却および監視システムなど、コンピューターの実行に必要なすべての電力を含む場合があります。多くの場合、電力測定はベンチマークの実行中に使用される平均電力ですが、電力使用の他の測定値(ピーク電力、アイドル電力など)を使用することもできます。
たとえば、初期のUNIVAC Iコンピューターは、1ワット秒あたり約0.015の操作を実行しました(125 kWを消費しながら、1秒あたり1,905の操作(OPS)を実行しました)。 2005年にリリースされた4 FR550コアバリアントのチップ上の富士通FR-V VLIW /ベクタープロセッサシステムは、3ワットの電力消費で51 Giga-OPSを実行し、1ワットあたり170億回の操作を行います。これは54年で1兆倍以上の改善です。
コンピューターが使用する電力のほとんどは熱に変換されるため、仕事をするのに必要なワット数が少ないシステムでは、所定の動作温度を維持するために必要な冷却が少なくなります。冷却の必要性が減ると、コンピューターの静音化が容易になります。また、エネルギー消費が少ないと、実行コストが低くなり、コンピューターに電力を供給することによる環境への影響を減らすことができます(グリーンコンピューティングを参照)。気候制御が限られている場所に設置すると、低電力のコンピューターはより低い温度で動作し、信頼性が向上する場合があります。気候制御された環境では、直接的な電力使用の削減は、気候制御エネルギーの節約にもなります。
EEMBC EnergyBenchなど、特定のベンチマークを実行するために必要なエネルギーを報告することにより、エネルギー消費の計算も測定される場合があります。標準ワークロードのエネルギー消費量の数値により、エネルギー効率の改善の効果を判断しやすくなる場合があります。
1ワット= 1ジュール/秒であるため、ワットあたりのパフォーマンス(操作/秒)は、操作/ワット秒、または操作/ジュールとして記述することもできます。
ワットあたりのフロップ
ワットあたりのフロップは一般的な尺度です。 FLOPS(1秒あたりの浮動小数点演算)メトリックと同様に、このメトリックは通常、多くの浮動小数点計算を含む科学計算およびシミュレーションに適用されます。
例
2016年6月の時点で、Green500リストは最も効率の高い2つのスーパーコンピューターを最も高く評価しています。どちらもIntel Xeonプロセッサーに加えて同じメニーコアアクセラレーターPEZY-SCnp日本技術に基づいています。 3番目にランク付けされたのは、6051.3 MFLOPS /ワットの中国技術のSunway TaihuLight(はるかに大きいマシンで、TOP500で2番目にランク付けされ、他のものはそのリストにありません)です。
2012年6月、Green500リストは、BlueGene / Q、Power BQC 16Cを、ワットあたりのFLOPSの観点からTOP500で最も効率的なスーパーコンピューターとして評価し、2,100.88 MFLOPS /ワットで実行しました。
2008年6月9日、CNNは、IBMのRoadrunnerスーパーコンピューターが376 MFLOPS / Wを達成したと報告しました。
2010年11月、IBMのマシン、Blue Gene / Qは1,684 MFLOPS / Wを達成しました。
IntelのTera-Scale研究プロジェクトの一環として、チームは16,000 MFLOPS /ワット以上を達成できる80コアCPUを生産しました。そのCPUの将来は確実ではありません。
Microwulfは、4つのデュアルコアAthlon 64 X2 3800+コンピューターの低価格デスクトップBeowulfクラスターで、58 MFLOPS /ワットで実行されます。
Kalrayは、25,000 MFLOPS /ワットを達成する256コアVLIW CPUを開発しました。次世代は、75,000 MFLOPS /ワットを達成する予定です。ただし、2019年の組み込み用の最新チップは80コアで、20 Wで最大4 TFLOPSを主張します。
Adaptevaは、75 GFLOPS / Wを達成することを目的とした1024コア64ビットRISCプロセッサであるEpiphany Vを発表しましたが、後にEpiphany Vが商用製品として利用可能になる可能性は低いと発表しました。
2018年7月の米国特許10,020,436は、100、300、および600 GFLOPS / wattの3つの間隔を主張しています。
Green500リスト
Green500リストは、エネルギー効率の観点からスーパーコンピューターのTOP500リストからコンピューターをランク付けします。エネルギー効率は、通常、ワットあたりのLINPACK FLOPSとして測定されます。
2012年11月の時点で、Appro International、Inc.のXtreme-Xスーパーコンピューター( Beacon )は、Green499リストの2499 LINPACK MFLOPS / Wを超えました。ビーコンはテネシー大学のNICSによって展開されており、GreenBlade GB824M、Xeon E5-2670ベース、8コア(8C)、2.6 GHz、Infiniband FDR、Intel Xeon Phi 5110Pコンピューターです。
2013年6月の時点で、CinecaのEurotechスーパーコンピューターEuroraは、3208 LINPACK MFLOPS / WでGreen500リストのトップにいました。 Cineca Euroraスーパーコンピューターには、ノードごとに2つのIntel Xeon E5-2687W CPUと2つのPCI-e接続NVIDIA Tesla K20アクセラレーターが装備されています。水冷と電子機器の設計により、ラックあたり350 TFLOPSのピークパフォーマンスで非常に高い密度を達成できます。
2014年11月現在、ドイツのダルムシュタットにあるGSIのHelmholtz AssociationのL-CSCスーパーコンピューターは、Green500リストで5271 MFLOPS / Wを超え、5 GFLOPS / Wの効率を超える最初のクラスターでした。 Intel Ivy Bridge ArchitectureおよびAMD FirePro S9150 GPU Acceleratorsを搭載したIntel Xeon E5-2690プロセッサーで実行されます。ラックの水冷および冷却塔で使用して、冷却に必要なエネルギーを削減します。
2015年8月現在、東京以外の理化学研究所のShoubuスーパーコンピューターはGreen500リストの7032 MFLOPS / Wを超えています。リストの上位3つのスーパーコンピューターは、それぞれ1024コアで6〜7 GFLOPS / Wの効率を持つPEZY ComputingのPEZY-SCアクセラレーター(OpenCLを使用するGPUのような)を使用しています。
2019年6月の時点で、「NVIDIA DGX-1 Volta36、Xeon E5-2698v4 20C 2.2GHz、Infiniband EDR、NVIDIA Tesla V100」を使用したDGX SaturnV Voltaは、Top500で469位にランクされながら、15,113 MFLOPS / WでGreen500リストを超えています。 IBM POWER9 CPUとNvidia Tesla V100 GPUを使用して、14,719 MFLOPS / WでTop500の2位にランクされた大規模なSummitよりもわずかに効率的です。
GPUの効率
グラフィックスプロセッシングユニット(GPU)はエネルギー使用量の増加を続けており、CPUの設計者は最近、ワットあたりのパフォーマンスの向上に注力しています。高性能GPUは大量の電力を消費する可能性があるため、GPUの電力消費を管理するにはインテリジェントな技術が必要です。ワットあたりの3DMark2006スコアなどの測定値は、より効率的なGPUの特定に役立ちます。ただし、要求の少ないタスクの実行に多くの時間が費やされる通常の使用では、効率が適切に組み込まれない場合があります。
最新のGPUでは、エネルギー使用量は、達成できる最大の計算能力に対する重要な制約です。通常、GPU設計は拡張性が高いため、メーカーは複数のチップを同じビデオカードに配置したり、並行して動作する複数のビデオカードを使用したりできます。システムのピークパフォーマンスは、消費できる電力量と放散できる熱量によって本質的に制限されます。そのため、GPUデザインのワットあたりのパフォーマンスは、そのデザインを使用するシステムのピークパフォーマンスに直接変換されます。
GPUは一部の汎用計算にも使用される可能性があるため、ワットあたりのFLOPSなど、CPUに適用される用語でパフォーマンスが測定される場合があります。
課題
ワットあたりのパフォーマンスは有用ですが、絶対的な電力要件も重要です。 1ワットあたりのパフォーマンスが向上したという主張は、電力需要の増加を隠すために使用できます。たとえば、新しい世代のGPUアーキテクチャはワットあたりのパフォーマンスが向上する可能性がありますが、継続的なパフォーマンスの向上は効率の向上を無効にし、GPUは大量の電力を消費し続けます。
重い負荷の下で電力を測定するベンチマークは、一般的な効率を適切に反映しない場合があります。たとえば、3DMarkはGPUの3Dパフォーマンスに重点を置いていますが、多くのコンピューターは、ほとんどの時間を集中的な表示タスク(アイドル、2Dタスク、ビデオの表示)に費やしています。したがって、グラフィックスシステムの2Dまたはアイドル効率は、全体的なエネルギー効率にとって少なくとも同じくらい重要です。同様に、多くの時間をスタンバイまたはソフトオフに費やすシステムは、負荷時の効率だけでは十分に特徴付けられません。これに対処するために、SPECpowerなどのいくつかのベンチマークには、一連の負荷レベルでの測定が含まれています。
電圧レギュレータなどの一部の電気部品の効率は、温度の上昇とともに低下するため、使用される電力は温度とともに上昇する場合があります。電源、マザーボード、一部のビデオカードは、この影響を受けるサブシステムの一部です。そのため、消費電力は温度に依存する可能性があり、測定時には温度または温度依存性に注意する必要があります。
ワットあたりのパフォーマンスには、通常、ライフサイクルコスト全体は含まれません。コンピューターの製造はエネルギー集約型であり、コンピューターの寿命は比較的短いことが多いため、生産、流通、廃棄、リサイクルに関与するエネルギーと材料は、多くの場合、コスト、エネルギー使用、環境影響のかなりの部分を占めます。
コンピューターの周囲の環境制御に必要なエネルギーは、多くの場合、ワット数の計算には含まれませんが、重要な場合があります。
その他のエネルギー効率対策
SWaP(スペース、ワット数、パフォーマンス)は、エネルギーとスペースを組み込んだデータセンターのSun Microsystemsのメトリックです。
SWaP =PerformanceSpace⋅Power{\ displaystyle \ mathrm {SWaP} = {\ frac {\ mathrm {Performance}} {\ mathrm {Space} \ cdot \ mathrm {Power}}}}パフォーマンスは適切なベンチマークによって測定され、スペースはコンピューターのサイズです。