動的実行

問題を報告するソースを表示夜間 · 7.3 · 7.2 · 7.1 · 7.0 · 6.5

動的実行は Bazel の機能で、最初の分岐の出力を使用して、同じアクションを並行して実行します。終了し、もう一方のブランチをキャンセルします。実行能力とリモートビルドシステムの大規模な共有キャッシュであり、ローカルインフラストラクチャのクリーンビルドと増分ビルドの両方の利点を活かしながらあります。

このページでは、動的実行の有効化、調整、デバッグを行う方法について説明します。もしローカル実行とリモート実行の両方が設定され、Bazel を調整しようとしているこのページはパフォーマンスの向上に役立ちます。まだない場合はリモート実行の設定については、Bazel リモート実行概要をご覧ください。

動的実行を有効にしますか？

動的実行モジュールは Bazel の一部ですが、動的実行モジュールをローカルとリモートの両方でコンパイルできていなければなりません同じ Bazel 設定を適用します。

動的実行モジュールを有効にするには、--internal_spawn_scheduler フラグを Bazel に設定します。これにより、dynamic という新しい実行戦略が追加されます。今すぐ動的実行が必要な記憶の戦略として、 --strategy=Javac=dynamic。ニーモニックを選択する方法については、次のセクションをご覧ください。動的実行を有効にする方法を選択できます

動的戦略を使用する任意のニモニックでは、リモート実行戦略は次のようになります。 --dynamic_remote_strategy フラグから取得し、ローカル戦略を --dynamic_local_strategy フラグ。合格 --dynamic_local_strategy=worker,sandboxed は、ローカル IP アドレスのデフォルトを設定します。ワーカーで試行する動的実行のブランチまたはサンドボックス化された実行をできます。--dynamic_local_strategy=Javac=worker を渡すと、デフォルトがオーバーライドされます。 Javac ニーモニックのみです。リモートバージョンも同じように動作します。どちらのフラグも複数回指定します。アクションをローカルで実行できない場合は、リモートで実行することも、その逆も可能です。

リモートシステムにキャッシュがある場合、--dynamic_local_execution_delay フラグは、リモートシステムが待機状態になった後、ローカル実行にミリ秒単位で遅延を追加します。キャッシュヒットを示していますこれにより、キャッシュヒットが増えてもローカルでの実行を回避できます可能性があります。デフォルト値は 1, 000 ミリ秒ですが、短く調整する必要があります。通常のキャッシュヒットよりも長い時間がかかります。実際の時間は、リモコンと往復の所要時間などです通常、この値は [ 一定のリモートシステムのすべてのユーザーに対して暗号化できます。ただし、往復レイテンシが増加しますBazel プロファイリングを使用: して、Google 検索におけるキャッシュヒットが消費されます

動的実行は、ローカルサンドボックス戦略だけでなく、永続ワーカー。永続ワーカーは動的実行で使用する場合はサンドボックス化され、ワーカー。Darwin および Windows システムでは戦略は時間がかかるものです。--reuse_sandbox_directories を渡してオーバーヘッドを削減できます。

動的実行は standalone 戦略でも実行できますが、 standalone 戦略は、実行開始時に出力ロックを受け取る必要があります。リモート戦略が先に終了することを効果的にブロックします。「この問題を回避するには、--experimental_local_lockfree_output フラグを使用します。ローカル実行では出力に直接書き込むことができますが、先に終了すべきです。

動的実行のブランチのいずれかが先に終了したものの失敗した場合、失敗します。これは、差異を防ぐために意図的に選択したものです。気づかれずに行われることを防げます。

動的実行とそのロックの仕組みの詳細については、Julio を参照してください。 Merino のブログ投稿

動的実行を使用するタイミング

動的実行には、なんらかの形式のリモート実行システムが必要です。現在のところ、キャッシュミスとしてキャッシュのみのリモートシステムを使用することはできません。アクションは失敗とみなされます

すべてのタイプのアクションがリモート実行に適しているわけではありません。最高のローカル環境で本質的に高速な永続ワーカー（高速に実行されるワーカー）の使用リモート実行のオーバーヘッドが実行時間の大半を占めるほどです。以降ローカルで実行されるアクションごとに、ある程度の CPU リソースとメモリリソースがロックされます。これらのカテゴリに当てはまらないアクションを実行しても、実行を遅らせるに過ぎないサポートしています

リリース時 5.0.0-pre.20210708.4, パフォーマンスプロファイリングには、たとえば、ワーカーの実行時間や、ワーカーの失敗します動的実行ワーカースレッドが表示される場合、リソースの確保に多大な時間を費やしたり async-worker-finish、低速のローカルアクションが原因でワーカーが遅延している可能性があります説明します。

動的実行のパフォーマンスが低いデータのプロファイリング

8 つの Javac ワーカーを使用する上記のプロファイルでは、多くの Javac ワーカーが確認できます。レースに負けて async-worker-finish で仕事を終えたユーザー説明します。これは、ワーカー以外の記憶装置が十分なリソースをワーカーを遅延させます

動的実行のパフォーマンスを向上させるデータのプロファイリング

動的実行で Javac のみを実行した場合、起動したリソースの約半分のみが就業後すぐにレースで負けてしまいます

以前に推奨されていた --experimental_spawn_scheduler フラグは非推奨になりました。動的実行が有効になり、dynamic がすべてのデフォルトの戦略として設定されますこの種の問題につながることがよくあります。

パフォーマンス

動的実行アプローチでは、利用可能なリソースが十分にあることを前提とする改善するために追加のリソースを費やす価値があることを向上させることができますただし、リソースの使用量が過剰になると Bazel 自体の速度が低下したり、リモートシステムに予期せぬ負荷がかかることもあります。他にも動的実行の動作を変更するオプションはいくつかあります。

--dynamic_local_execution_delay は、ローカルブランチの開始を数値だけ遅延させます。ミリ秒単位の経過時間。ただし、リモートブランチがリモートキャッシュヒットを検出しました。そのためリモートキャッシュからローカルリソースを浪費することはありません。キャッシュにあります。キャッシュの品質によっては、この値を減らすと、ビルド速度が向上する可能性がありますが、説明します。

--experimental_dynamic_local_load_factor は試験運用版の高度なリソースです管理オプションを使用できます。0 から 1 までの値を取ります。0 でこの機能が無効になります。 0 より大きい値に設定すると、Bazel はノードの数を調整し、ローカルにスケジュール設定されたアクションの場合は、スケジュール設定できます。1 に設定すると、必要な数のアクションのスケジュールを設定できます使用可能な CPU です（--local_cpu_resources に基づく）。値が小さいほどアクションのスケジュールは、アクションの数が多くなるにつれて、それに比例して少なくなります。確認できます。直感に反するかもしれませんが、優れたリモコンを使えばローカル実行は、多くのアクションが実行されているときにあまり役に立ちません。リモートアクションの管理にローカル CPU を使用する方が効率的です。

--experimental_dynamic_slow_remote_time がローカルブランチの開始を優先するリモートブランチが少なくともこれほど長く実行されているとき通常、最も新しいタイミングでのアクションが優先され、リモートシステムがハングしたりかなりの時間がかかったりすると構築する可能性も高まりますこれはデフォルトでは有効になっていないため、リモートシステムの問題が隠れてしまう可能性があります。確認事項を使用してリモートシステムのパフォーマンスをモニタリングできます。

--experimental_dynamic_ignore_local_signals を使用すると、リモコンで操作できるようになります。特定のシグナルによってローカルの Spwn が終了したときに、ブランチが引き継ぎます。これは、ワーカーリソースの上限（ --experimental_worker_memory_limit_mb --experimental_worker_sandbox_hardening, および --experimental_sandbox_memory_limit_mb)), ワーカープロセスがリソースを使いすぎると強制終了されるおそれがあります。

JSON トレースプロファイルには、パフォーマンス関連のグラフが多数用意されています。これらのグラフを元に、パフォーマンスとリソース使用量のトレードオフが発生します

トラブルシューティング

動的実行の問題は微妙で、デバッグが困難な場合があるローカル実行とリモート実行の特定の組み合わせでのみマニフェストを利用できます。 --debug_spawn_scheduler は、動的実行からの追加出力を追加します。いくつか見てみましょうまた、 --dynamic_local_execution_delay フラグと、リモートジョブとローカルジョブの数の比較問題の再現が容易になります

standalone を使用した動的実行の問題が発生している場合 --experimental_local_lockfree_output を使用せずに実行するか、次を実行します。ローカルアクションをサンドボックス化します。これによりビルドが遅くなる可能性があります（上記の Mac または Windows を使用している場合など）ですが、考えられるエラーの原因を取り除きます。