A Build Foundation começou a inscrever membros fundadores! Participe da lista de e-mails, leia o contrato de participação e inscreva-se.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Detalhamento do desempenho do build

Informar um problema Ver código-fonte

Nightly · 9.1 · 9.0 · 8.7 · 8.6 · 8.5 · 8.4 · 8.3 · 8.2 · 8.1

O Bazel é complexo e faz muitas coisas diferentes ao longo de um build, algumas das quais podem afetar o desempenho. Esta página tenta mapear alguns desses conceitos do Bazel e as implicações deles no desempenho da build. Embora não seja extensa, incluímos alguns exemplos de como detectar problemas de desempenho de build extraindo métricas e o que você pode fazer para corrigi-los. Assim, esperamos que você possa aplicar esses conceitos ao investigar regressões de performance de build.

Builds limpos x incrementais

Um build limpo cria tudo do zero, enquanto um build incremental reutiliza alguns trabalhos já concluídos.

Sugerimos analisar builds limpos e incrementais separadamente, principalmente quando você coleta / agrega métricas que dependem do estado dos caches do Bazel (por exemplo, métricas de tamanho da solicitação de build). Eles também representam duas experiências de usuário diferentes. Em comparação com a inicialização de um build limpo do zero (que leva mais tempo devido a um cache frio), os builds incrementais acontecem com muito mais frequência à medida que os desenvolvedores iteram no código (normalmente mais rápido, já que o cache geralmente já está quente).

Você pode usar o campo CumulativeMetrics.num_analyses no BEP para classificar builds. Se num_analyses <= 1, é um build limpo. Caso contrário, podemos categorizar de forma geral como um build incremental. O usuário pode ter mudado para flags ou destinos diferentes, causando um build efetivamente limpo. Qualquer definição mais rigorosa de incrementalidade provavelmente terá que vir na forma de uma heurística, por exemplo, analisando o número de pacotes carregados (PackageMetrics.packages_loaded).

Métricas de build determinísticas como um proxy para o desempenho do build

Medir o desempenho da build pode ser difícil devido à natureza não determinística de determinadas métricas (por exemplo, tempo de CPU do Bazel ou tempos de fila em um cluster remoto). Por isso, é útil usar métricas determinísticas como um proxy da quantidade de trabalho feita pelo Bazel, o que afeta a performance dele.

O tamanho de uma solicitação de build pode ter uma implicação significativa no desempenho do build. Um build maior pode representar mais trabalho na análise e construção dos gráficos de build. O crescimento orgânico dos builds acontece naturalmente com o desenvolvimento, à medida que mais dependências são adicionadas/criadas. Assim, a complexidade aumenta e o custo de build também.

Podemos dividir esse problema nas várias fases de build e usar as seguintes métricas como proxy para o trabalho realizado em cada fase:

PackageMetrics.packages_loaded: o número de pacotes carregados com sucesso. Uma regressão aqui representa mais trabalho que precisa ser feito para ler e analisar cada arquivo BUILD adicional na fase de carregamento.
- Isso geralmente acontece devido à adição de dependências e à necessidade de carregar o fechamento transitivo delas.
- Use query / cquery para encontrar onde novas dependências podem ter sido adicionadas.
TargetMetrics.targets_configured: representando o número de destinos e aspectos configurados no build. Uma regressão representa mais trabalho na construção e no percurso do gráfico de destino configurado.
- Isso geralmente acontece devido à adição de dependências e à necessidade de construir o grafo do fechamento transitivo delas.
- Use cquery para encontrar onde novas dependências podem ter sido adicionadas.
ActionSummary.actions_created: representa as ações criadas no build, e uma regressão representa mais trabalho na construção do gráfico de ações. Observe que isso também inclui ações não usadas que podem não ter sido executadas.
- Use aquery para depurar regressões. Sugerimos começar com --output=summary antes de detalhar mais com --skyframe_state.
ActionSummary.actions_executed: o número de ações executadas. Uma regressão representa diretamente mais trabalho na execução dessas ações.
- O BEP grava as estatísticas de ação ActionData que mostram os tipos de ação mais executados. Por padrão, ele coleta os 20 principais tipos de ação, mas você pode transmitir o --experimental_record_metrics_for_all_mnemonics para coletar esses dados de todos os tipos de ação executados.
- Isso vai ajudar você a descobrir que tipo de ações foram executadas (além disso).
BuildGraphSummary.outputArtifactCount: o número de artefatos criados pelas ações executadas.
- Se o número de ações executadas não aumentou, é provável que uma implementação de regra tenha sido alterada.

Todas essas métricas são afetadas pelo estado do cache local. Portanto, verifique se os builds de que você extrai essas métricas são builds limpos.

Notamos que uma regressão em qualquer uma dessas métricas pode ser acompanhada de regressões no tempo decorrido, no tempo de CPU e no uso da memória.

Uso de recursos locais

O Bazel consome vários recursos na sua máquina local (tanto para analisar o gráfico de build e impulsionar a execução quanto para executar ações locais). Isso pode afetar o desempenho / disponibilidade da máquina ao realizar o build e outras tarefas.

Tempo gasto

Talvez as métricas mais suscetíveis a ruídos (e que podem variar muito de build para build) sejam as de tempo, principalmente tempo decorrido, Tempo de CPU e tempo de sistema. Use o bazel-bench para receber um comparativo dessas métricas. Com um número suficiente de --runs, é possível aumentar a significância estatística da sua medição.

O tempo real é o tempo decorrido no mundo real.
- Se apenas o tempo decorrido regredir, recomendamos coletar um perfil de trace JSON e procurar diferenças. Caso contrário, provavelmente seria mais eficiente investigar outras métricas de regressão, já que elas podem ter afetado o tempo real.
Tempo de CPU é o tempo gasto pela CPU executando o código do usuário.
- Se o tempo de CPU regredir em dois commits de projeto, sugerimos coletar um perfil de CPU do Starlark. Também é recomendável usar --nobuild para restringir o build à fase de análise, já que é onde a maior parte do trabalho pesado da CPU é feita.
O tempo do sistema é o tempo gasto pela CPU no kernel.
- Se o tempo do sistema regredir, isso estará principalmente correlacionado com E/S quando o Bazel ler arquivos do seu sistema de arquivos.

Criação de perfis de carga em todo o sistema

Usando a flag --experimental_collect_load_average_in_profiler introduzida no Bazel 6.0, o criador de perfil de rastreamento JSON coleta a média de carga do sistema durante a invocação.

Figura 1. Perfil que inclui a média de carga do sistema.

Uma carga alta durante uma invocação do Bazel pode indicar que o Bazel programa muitas ações locais em paralelo para sua máquina. Talvez seja interessante ajustar --local_cpu_resources e --local_ram_resources, principalmente em ambientes de contêineres (pelo menos até que #16512 seja mesclado).

Como monitorar o uso da memória do Bazel

Há duas fontes principais para saber o uso da memória do Bazel: o info do Bazel e o BEP.

bazel info used-heap-size-after-gc: a quantidade de memória usada em bytes após uma chamada para System.gc().
- O Bazel bench também fornece comparativos de mercado para essa métrica.
- Além disso, há peak-heap-size, max-heap-size, used-heap-size e committed-heap-size (consulte a documentação), mas eles são menos relevantes.
MemoryMetrics.peak_post_gc_heap_size do BEP: tamanho do pico do heap da JVM em bytes após a coleta de lixo (requer a definição de --memory_profile que tenta forçar uma coleta de lixo completa).

Uma regressão no uso da memória geralmente é resultado de uma regressão nas métricas de tamanho da solicitação de build, que geralmente são causadas pela adição de dependências ou uma mudança na implementação da regra.

Para analisar o consumo de memória do Bazel em um nível mais granular, recomendamos usar o profiler de memória integrado para regras.

Criação de perfil de memória de workers persistentes

Embora os workers persistentes possam ajudar a acelerar significativamente os builds (especialmente para linguagens interpretadas), a pegada de memória deles pode ser problemática. O Bazel coleta métricas sobre os workers. Em particular, o campo WorkerMetrics.WorkerStats.worker_memory_in_kb informa quanta memória os workers usam (por mnemônico).

O criador de perfil de rastreamento JSON também coleta o uso da memória do worker persistente durante a invocação transmitindo a flag --experimental_collect_system_network_usage (nova no Bazel 6.0).

Figura 2. Perfil que inclui o uso da memória pelos workers.

Diminuir o valor de --worker_max_instances (padrão 4) pode ajudar a reduzir a quantidade de memória usada por workers persistentes. Estamos trabalhando ativamente para tornar o gerenciador de recursos e o agendador do Bazel mais inteligentes para que esse ajuste fino seja necessário com menos frequência no futuro.

Monitorar o tráfego de rede para builds remotos

Na execução remota, o Bazel faz o download de artefatos criados como resultado da execução de ações. Por isso, a largura de banda da sua rede pode afetar o desempenho da compilação.

Se você estiver usando a execução remota para seus builds, considere monitorar o tráfego de rede durante a invocação usando o proto NetworkMetrics.SystemNetworkStats do BEP (exige a transmissão de --experimental_collect_system_network_usage).

Além disso, os perfis de rastreamento JSON permitem visualizar o uso da rede em todo o sistema durante o processo de build transmitindo a flag --experimental_collect_system_network_usage (nova no Bazel 6.0).

Figura 3. Perfil que inclui o uso da rede em todo o sistema.

Um uso de rede alto, mas relativamente estável, ao usar a execução remota pode indicar que a rede é o gargalo no seu build. Se você ainda não estiver usando, considere ativar o Build without the Bytes transmitindo --remote_download_minimal. Isso acelera os builds, evitando o download de artefatos intermediários desnecessários.

Outra opção é configurar um cache de disco local para economizar largura de banda de download.

Detalhamento do desempenho do build Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.