Menyesuaikan Aturan Bazel untuk Eksekusi Jarak Jauh

Halaman ini ditujukan bagi pengguna Bazel yang menulis aturan build dan pengujian kustom yang ingin memahami persyaratan aturan Bazel dalam konteks eksekusi jarak jauh.

Eksekusi jarak jauh memungkinkan Bazel menjalankan tindakan pada platform terpisah, seperti pusat data. Bazel menggunakan protokol gRPC untuk eksekusi jarak jauh. Anda dapat mencoba eksekusi jarak jauh dengan bazel-buildfarm, sebuah project open source yang bertujuan menyediakan platform eksekusi jarak jauh yang terdistribusi.

Halaman ini menggunakan terminologi berikut saat merujuk ke berbagai jenis lingkungan atau platform:

  • Platform host - tempat Bazel berjalan.
  • Platform eksekusi - tempat tindakan Bazel dijalankan.
  • Platform target - tempat output build (dan beberapa tindakan) dijalankan.

Ringkasan

Saat mengonfigurasi build Bazel untuk eksekusi jarak jauh, Anda harus mengikuti panduan yang dijelaskan di halaman ini untuk memastikan build dijalankan tanpa error dari jarak jauh. Hal ini disebabkan oleh sifat eksekusi jarak jauh, yaitu:

  • Tindakan build terisolasi. Alat build tidak mempertahankan status dan dependensi tidak boleh bocor di antara keduanya.

  • Lingkungan eksekusi yang beragam. Konfigurasi build lokal tidak selalu cocok untuk lingkungan eksekusi jarak jauh.

Halaman ini menjelaskan masalah yang dapat muncul ketika menerapkan aturan build dan pengujian Bazel kustom untuk eksekusi jarak jauh serta cara menghindarinya. Topik ini mencakup topik berikut:

Memanggil alat build melalui aturan toolchain

Aturan toolchain Bazel adalah penyedia konfigurasi yang memberi tahu aturan build alat build apa, seperti compiler dan penaut, yang akan digunakan dan cara mengonfigurasinya menggunakan parameter yang ditentukan oleh pembuat aturan. Aturan toolchain memungkinkan aturan build dan pengujian untuk memanggil alat build dengan cara yang dapat diprediksi dan telah dikonfigurasi yang kompatibel dengan eksekusi jarak jauh. Misalnya, gunakan aturan toolchain, bukan memanggil alat build melalui PATH, JAVA_HOME, atau variabel lokal lainnya yang mungkin tidak disetel ke nilai yang setara (atau tidak sama sekali) di lingkungan eksekusi jarak jauh.

Saat ini, aturan toolchain ada bagi aturan build dan pengujian Bazel untuk Scala, Rust, dan Go, dan aturan toolchain baru sedang diterapkan untuk alat dan bahasa lain seperti bash. Jika aturan toolchain tidak ada untuk alat yang digunakan aturan Anda, pertimbangkan untuk membuat aturan toolchain.

Mengelola dependensi implisit

Jika alat build dapat mengakses dependensi di seluruh tindakan build, tindakan tersebut akan gagal dijalankan dari jarak jauh karena setiap tindakan build jarak jauh dijalankan secara terpisah dari yang lain. Beberapa alat build mempertahankan status di seluruh tindakan build dan dependensi akses yang belum disertakan secara eksplisit dalam pemanggilan alat, yang akan menyebabkan tindakan build yang dijalankan dari jarak jauh gagal.

Misalnya, saat Bazel menginstruksikan compiler stateful untuk membuat foo secara lokal, compiler akan mempertahankan referensi ke output build foo. Saat Bazel kemudian memerintahkan compiler untuk membuat bar, yang bergantung pada foo, tanpa menyatakan secara eksplisit bahwa dependensi dalam file BUILD untuk disertakan dalam pemanggilan compiler, tindakan akan berhasil dijalankan selama instance compiler yang sama dieksekusi untuk kedua tindakan tersebut (seperti yang umum untuk eksekusi lokal). Namun, karena dalam skenario eksekusi jarak jauh, setiap tindakan build mengeksekusi instance compiler terpisah, status compiler dan dependensi implisit bar pada foo akan hilang dan build akan gagal.

Untuk membantu mendeteksi dan menghilangkan masalah dependensi ini, Bazel 0.14.1 menawarkan sandbox Docker lokal, yang memiliki batasan yang sama untuk dependensi seperti eksekusi jarak jauh. Gunakan sandbox guna menyiapkan build untuk dieksekusi dari jarak jauh dengan mengidentifikasi dan menyelesaikan error build terkait dependensi. Lihat Memecahkan Masalah Bazel Remote Execution dengan Docker Sandbox untuk mengetahui informasi selengkapnya.

Mengelola biner yang bergantung pada platform

Biasanya, biner yang di-build di platform host tidak dapat dieksekusi dengan aman di platform eksekusi jarak jauh arbitrer karena dependensi yang berpotensi tidak cocok. Misalnya, biner SingleJar yang disediakan dengan Bazel menargetkan platform host. Namun, untuk eksekusi jarak jauh, SingleJar harus dikompilasi sebagai bagian dari proses pembuatan kode agar dapat menargetkan platform eksekusi jarak jauh. (Lihat logika pemilihan target.)

Jangan mengirimkan biner alat build yang diperlukan oleh build dengan kode sumber Anda, kecuali jika Anda yakin alat tersebut akan berjalan dengan aman di platform eksekusi Anda. Sebagai gantinya, lakukan salah satu hal berikut:

  • Kirimkan atau rujuk kode sumber untuk alat secara eksternal sehingga dapat dibuat untuk platform eksekusi jarak jauh.

  • Instal alat terlebih dahulu ke lingkungan eksekusi jarak jauh (misalnya, container toolchain) jika sudah cukup stabil dan gunakan aturan toolchain untuk menjalankannya di build Anda.

Mengelola konfigurasi aturan WORKSPACE bergaya konfigurasi

Aturan WORKSPACE Bazel dapat digunakan untuk menyelidiki platform host untuk alat dan library yang diperlukan oleh build, yang juga merupakan platform eksekusi Bazel untuk build lokal. Jika build secara eksplisit bergantung pada alat dan artefak build lokal, build akan gagal selama eksekusi jarak jauh jika platform eksekusi jarak jauh tidak identik dengan platform host.

Tindakan berikut yang dijalankan oleh aturan WORKSPACE tidak kompatibel dengan eksekusi jarak jauh:

  • Membuat biner. Mengeksekusi tindakan kompilasi dalam aturan WORKSPACE akan menghasilkan biner yang tidak kompatibel dengan platform eksekusi jarak jauh jika berbeda dengan platform host.

  • Menginstal paket pip. Paket pip yang diinstal melalui aturan WORKSPACE memerlukan dependensinya yang sudah diinstal sebelumnya di platform host. Paket tersebut, yang dibangun khusus untuk platform host, tidak akan kompatibel dengan platform eksekusi jarak jauh jika berbeda dengan platform host.

  • Menghubungkan ke artefak atau alat lokal. Symlink ke alat atau library yang diinstal di platform host yang dibuat melalui aturan WORKSPACE akan menyebabkan build gagal pada platform eksekusi jarak jauh karena Bazel tidak akan dapat menemukannya. Sebagai gantinya, buat symlink menggunakan tindakan build standar sehingga library dan alat symlink dapat diakses dari hierarki runfiles Bazel. Jangan gunakan repository_ctx.symlink untuk membuat symlink file target di luar direktori repo eksternal.

  • Mengubah platform host. Hindari membuat file di luar hierarki runfiles Bazel, membuat variabel lingkungan, dan tindakan serupa, karena dapat berperilaku tidak terduga di platform eksekusi jarak jauh.

Untuk membantu menemukan potensi perilaku non-hermetik, Anda dapat menggunakan log aturan Workspace.

Jika dependensi eksternal menjalankan operasi tertentu yang bergantung pada platform host, Anda harus membagi operasi tersebut antara WORKSPACE dan aturan build sebagai berikut:

  • Pemeriksaan platform dan enumerasi dependensi. Operasi ini aman dijalankan secara lokal melalui aturan WORKSPACE, yang dapat memeriksa library mana yang diinstal, mendownload paket yang harus di-build, dan menyiapkan artefak yang diperlukan untuk kompilasi. Untuk eksekusi jarak jauh, aturan ini juga harus mendukung penggunaan artefak yang sudah diperiksa sebelumnya untuk memberikan informasi yang biasanya diperoleh selama pemeriksaan platform host. Artefak yang sudah diperiksa sebelumnya memungkinkan Bazel mendeskripsikan dependensi seolah-olah dependensi tersebut bersifat lokal. Gunakan pernyataan bersyarat atau flag --override_repository untuk ini.

  • Membuat atau mengompilasi artefak khusus target dan mutasi platform. Operasi ini harus dijalankan melalui aturan build reguler. Tindakan yang menghasilkan artefak khusus target untuk dependensi eksternal harus dijalankan selama build.

Agar lebih mudah menghasilkan artefak yang telah diperiksa sebelumnya untuk eksekusi jarak jauh, Anda dapat menggunakan aturan WORKSPACE untuk memunculkan file yang dihasilkan. Anda dapat menjalankan aturan tersebut pada setiap lingkungan eksekusi baru, seperti di dalam setiap container toolchain, dan memeriksa output build eksekusi jarak jauh ke repo sumber sebagai referensi.

Misalnya, untuk aturan Tensorflow untuk cuda dan python, aturan WORKSPACE menghasilkan BUILD files berikut. Untuk eksekusi lokal, file yang dihasilkan dengan memeriksa lingkungan host akan digunakan. Untuk eksekusi jarak jauh, pernyataan bersyarat pada variabel lingkungan memungkinkan aturan untuk menggunakan file yang di-check dalam repo.

File BUILD mendeklarasikan genrules yang dapat berjalan secara lokal dan jarak jauh, serta melakukan pemrosesan yang diperlukan yang sebelumnya dilakukan melalui repository_ctx.symlink seperti yang ditampilkan di sini.