BazelCon 2024 登録の受け付けを開始しました。

このページは Cloud Translation API によって翻訳されました。

ビルドのパフォーマンスの内訳

<ph type="x-smartling-placeholder"></ph> 問題を報告するソースを表示夜間 · 7.3 · 7.2 · 7.1 · 7.0 · 6.5

Bazel は複雑で、ビルドの過程でさまざまな処理を行います。その一部はビルドのパフォーマンスに影響する可能性があります。このページではそれらのコンセプトがビルドパフォーマンスに及ぼす影響を理解しましょう。しばらくビルドのパフォーマンスを検出する方法の例を指標の抽出を使用して問題を特定し、その修正方法を確認しますここまで、これらのコンセプトを Chronicle のおすすめします

クリーンビルドと増分ビルド

クリーンビルドとは、すべてをゼロからビルドする一方で、増分ビルドとは、すでに完了した作業が再利用されます。

特に、クリーンビルドと増分ビルドを個別に検討することをおすすめします。状態に依存する指標を収集 / 集計する Bazel のキャッシュ（ビルドリクエストサイズの指標をご覧ください）。また、これらは 2 つの異なるユーザーエクスペリエンスを表しています。運用開始とゼロからのクリーンビルド（コールドキャッシュのため時間がかかるため）、増分ビルド開発者がコードを反復処理するにつれビルドが頻繁にキャッシュが通常はウォーム状態になっているため、処理が速くなります）。

BEP の CumulativeMetrics.num_analyses フィールドを使用して、説明します。num_analyses <= 1 の場合は、クリーンビルドです。そうでなければ、広範に増分ビルドである可能性として分類します - ユーザーが切り替えた可能性があります効果的にクリーンなビルドができるようになります。制限なしより厳密なインクリメンタリティの定義は、たとえば、読み込まれたパッケージの数や、（PackageMetrics.packages_loaded）。

ビルドパフォーマンスのプロキシとして決定的なビルド指標

非決定的な性質のため、ビルドのパフォーマンスの測定が難しい場合がある特定の指標（たとえば、リモートリソースでの Bazel の CPU 時間やです。そのため、決定的な指標を指標の代替として使用すれば、 Bazel によって行われる作業の量が減るため、それがパフォーマンスに影響します。

ビルドリクエストのサイズはビルドに大きな影響を与える可能性がある向上しますビルドが大きいほど、分析とメンテナンスの作業量が多くなる構築グラフの作成ですビルドの有機的な成長は依存関係が追加/作成され、複雑さが増すと、構築費用も高くなります

この問題は、さまざまなビルドフェーズに分割できます。各フェーズで行われた作業の代理指標として使用できます。

PackageMetrics.packages_loaded: 正常に読み込まれたパッケージの数。ここでの回帰は、読み取りと解析のために実行する必要がある作業が増えることを意味します。追加する各 BUILD ファイルを読み込みフェーズで呼び出します。
- これは多くの場合、依存関係が追加されて、依存関係を読み込んでことがあります。
- query / cquery を使用して検索する新しい依存関係が追加された可能性があります。
TargetMetrics.targets_configured: ターゲットの数とアスペクトが含まれます回帰は、本番環境における構成したターゲットグラフを作成して走査します。
- これは多くの場合、依存関係の追加と、インスタンス構成の推移的クロージャのグラフです
- cquery を使って追加された可能性があります。
ActionSummary.actions_created: ビルドで作成されたアクションを表します。回帰はアクショングラフの作成に手間がかかることを表します。備考これには実行されなかった可能性のある未使用のアクションも含まれます。
- 回帰のデバッグには aquery を使用します。まずは --output=summary さらにドリルダウンして --skyframe_state。
ActionSummary.actions_executed: 実行されたアクションの数回帰は、これらのアクションの実行にかかる作業が増えることを意味します。
- BEP がアクションの統計情報を書き出します。最も多く実行されたアクションタイプを表示する ActionData。デフォルトでは、上位 20 のアクションタイプを収集しますが、 --experimental_record_metrics_for_all_mnemonics 実行されたすべてのアクションタイプのデータを収集します。
- これにより、どのようなアクションが行われたかを確認できます。（追加で参照できます）。
BuildGraphSummary.outputArtifactCount: 作成されたアーティファクトの数アクションを実行します。
- 実行されたアクションの数が増加しなかった場合、ルールの実装が変更されました。

これらの指標はすべてローカルキャッシュの状態の影響を受けるため、これらの指標を抽出できるビルドが クリーンビルドです。

これらの指標のいずれかで回帰が発生すると、経過時間、CPU 時間、メモリ使用量の回帰

ローカルリソースの使用

Bazel はローカルマシンでさまざまなリソースを使用します（どちらも分析、実行、ローカルアクションの実行など）です。パフォーマンスや可用性に影響することがあります。タスクを実行できます。

かかった時間

おそらく、ノイズの影響を最も受けやすい指標は（ビルドによって大きく異なる可能性がある）時間です。具体的には経過時間、CPU 時間、システム時間です。Google Chat では bazel-bench を使用してこれらの指標のベンチマークが必要です。また、十分な数の --runs があれば、測定の統計的有意性を高める

経過時間は、実際の経過時間です。
- 経過時間のみが回帰する場合は、 JSON トレースプロファイルを確認して、確認します。そうでない場合は、事前トレーニング済みモデルを使用したウォールに影響した可能性があるため、他の回帰指標を調査するあります。
CPU 時間は、CPU がユーザーコードを実行するのに費やした時間です。
- CPU 時間が 2 つのプロジェクトの commit 間で回帰している場合は、 Starlark CPU プロファイルですまた、--nobuild を使用して、ビルドは分析フェーズに限定されます。分析フェーズでは、ほとんどのビルドが CPU の負荷が高い処理は完了しています
システム時間は、カーネル内の CPU が費やした時間です。
- システム時間が回帰すると、ほとんどの場合、Bazel が読み取るときに I/O と相関します。ファイルシステムのファイル。

システム全体の負荷プロファイリング

--experimental_collect_load_average_in_profiler Bazel 6.0 で導入された JSON Trace Profiler は、呼び出し中のシステム負荷の平均値。

図 1. システム負荷平均を含むプロファイル。

Bazel 呼び出し中の負荷が高い場合は、Bazel がスケジュールを示している可能性があります。ローカルアクションが多すぎます。エラーの原因が調整中 --local_cpu_resources および --local_ram_resources、特にコンテナ環境では特にそうです（少なくとも #16512 が統合されます）。

Bazel メモリ使用量のモニタリング

Bazel のメモリ使用量は、主に Bazel info と BEP。

bazel info used-heap-size-after-gc: System.gc() への呼び出し。
- Bazel ベンチこの指標のベンチマークも表示されます
- さらに、peak-heap-size、max-heap-size、used-heap-size があります。および committed-heap-size（参照: ドキュメントをご覧ください）。低減します
BEP MemoryMetrics.peak_post_gc_heap_size: JVM ヒープのピークサイズ（単位: GC 後のバイト数（設定が必要） --memory_profile 使用している場合）。

メモリ使用量の回帰は通常、ビルドリクエストサイズの指標しばしば依存関係の追加やルールの変更が原因です。説明します。

Bazel のメモリ使用量をより詳細に分析するには、以下を使用することをおすすめします。組み込みの Memory Profiler 使用できます。

永続ワーカーのメモリプロファイリング

永続ワーカーはビルドの高速化に役立ちますが、メモリ使用量が大幅に増えます（特にインタプリタ言語の場合）。問題になります。Bazel はワーカーに関する指標を収集します。特に、 WorkerMetrics.WorkerStats.worker_memory_in_kb フィールドはメモリ容量を示します。ワーカーが使用する（ニモニックによって）

JSON Trace Profiler も呼び出し中に永続ワーカーのメモリ使用量を収集するには、 --experimental_collect_system_network_usage フラグ（Bazel 6.0 で導入）です。

図 2. ワーカーのメモリ使用量を含むプロファイル。

クラウドセキュリティの --worker_max_instances （デフォルトは 4）は、永続ワーカーが使用するメモリの量。私たちは Bazel のリソースマネージャーとスケジューラをスマート化して、必要になる頻度は低くなります。

リモートビルドのネットワークトラフィックのモニタリング

リモート実行では、Bazel はリモート実行の結果としてビルドされたアーティファクトをダウンロードします。アクションの実行などですそのため、ネットワーク帯域幅がパフォーマンスに影響を与える可能性があるできます。

ビルドにリモート実行を使用する場合は、 gcloud コマンドを使用して呼び出し中のネットワークトラフィックを監視し、 BEP の NetworkMetrics.SystemNetworkStats プロトコル（--experimental_collect_system_network_usage を渡す必要があります）。

また、JSON トレースプロファイルビルドプロセス全体を通じてシステム全体のネットワーク使用状況を表示 --experimental_collect_system_network_usage フラグを渡すことで設定します（Bazel での新機能） 6.0）。

図 3. システム全体のネットワーク使用状況を含むプロファイル。

リモート実行使用時のネットワーク使用量は高いもののかなりフラットな場合、ネットワークがビルドのボトルネックだとしたらまだ使用していない場合は代わりに Bytes を使わずにビルドを --remote_download_minimal。これにより、不要な中間アーティファクトのダウンロードが回避され、ビルドが高速化されます。

もう 1 つの方法は、ローカル節約できるディスクキャッシュダウンロード帯域幅を消費します。

ビルドのパフォーマンスの内訳

クリーンビルドと増分ビルド

ビルド パフォーマンスのプロキシとして決定的なビルド指標

ローカル リソースの使用