本頁面由 Cloud Translation API 翻譯而成。

分散式版本

每日 · 8.5 · 8.4 · 8.3 · 8.2 · 8.1 · 8.0 · 7.7

如果程式碼集很大，依附元件鏈可能會變得非常深層。即使是簡單的二進位檔，也可能依附於數萬個建構目標。在這種規模下，單一機器根本不可能在合理的時間內完成建構作業：沒有任何建構系統可以規避機器硬體的基本物理定律。如要達成這個目標，唯一的方法是使用支援分散式建構的建構系統，讓系統執行的工作單元分散在任意數量的機器上，並可隨意擴充。假設我們已將系統工作劃分為足夠小的單元 (稍後會詳細說明)，這樣一來，我們就能以願意支付的費用，盡快完成任何大小的建構作業。我們定義以構件為基礎的建構系統，就是為了實現這種擴充性。

遠端快取

最簡單的類型是只運用遠端快取的分散式建構，如圖 1 所示。

圖 1. 顯示遠端快取的分散式建構

執行建構作業的每個系統 (包括開發人員工作站和持續整合系統) 都會共用通用遠端快取服務的參照。這項服務可以是 Redis 等快速的本機短期儲存系統，也可以是 Google Cloud Storage 等雲端服務。每當使用者需要建構構件 (無論是直接建構或做為依附元件)，系統都會先檢查遠端快取，確認該構件是否已存在。如果是，系統可以下載構件，不必建構。如果沒有，系統會自行建構構件，並將結果上傳回快取。也就是說，不常變更的低階依附元件可以建構一次，並在使用者之間共用，不必由每位使用者重建。在 Google，許多構件都是從快取提供，而非從頭建構，因此大幅降低了建構系統的執行成本。

如要讓遠端快取系統運作，建構系統必須確保建構作業完全可重現。也就是說，對於任何建構目標，都必須能夠判斷該目標的輸入內容集，這樣一來，在任何機器上，相同的輸入內容集都會產生完全相同的輸出內容。這是確保下載構件的結果與自行建構結果相同的唯一方法。請注意，這需要快取中的每個構件都以目標和輸入內容的雜湊為鍵，這樣一來，不同的工程師就能同時對相同目標進行不同的修改，而遠端快取會儲存所有產生的構件，並適當提供這些構件，不會發生衝突。

當然，要從遠端快取獲得任何好處，下載構件的速度就必須比建構構件更快。但並非一律如此，尤其是在快取伺服器遠離建構機器的情況下。Google 的網路和建構系統經過仔細調整，可快速分享建構結果。

遠端執行

遠端快取並非真正的分散式建構作業。如果快取遺失，或是您進行低階變更，導致所有內容都必須重建，您仍需在本機上執行完整建構作業。真正的目標是支援遠端執行，讓建構的實際工作可分散到任意數量的工作站。圖 2 顯示遠端執行系統。

圖 2. 遠端執行系統

在每位使用者的電腦上執行的建構工具 (使用者可以是工程師或自動化建構系統) 會將要求傳送至中央建構主機。建構主機將要求分解為元件動作，並排定這些動作在可擴充的工作站集區中執行。每個工作人員都會根據使用者指定的輸入內容執行要求動作，並寫出產生的構件。這些構件會與執行需要這些構件的動作的其他機器共用，直到產生最終輸出並傳送給使用者為止。

實作這類系統最棘手的部分，就是管理工作站、主機和使用者本機之間的通訊。Worker 可能會依賴其他 Worker 產生的中繼構件，最終輸出內容則必須傳回使用者的本機。為此，我們可以根據先前所述的分散式快取，讓每個工作人員將結果寫入快取，並從快取讀取依附元件。主節點會封鎖工作人員，直到所有依附項目完成為止，屆時工作人員就能從快取讀取輸入內容。最終產品也會快取，方便本機下載。請注意，我們也需要另外一種方式匯出使用者來源樹狀結構中的本機變更，以便工作人員在建構前套用這些變更。

如要讓這項功能運作，必須整合先前所述的構件式建構系統所有部分。建構環境必須完全自我描述，我們才能在不須人為介入的情況下啟動工作人員。建構程序本身必須完全獨立，因為每個步驟都可能在不同的機器上執行。輸出內容必須完全具決定性，這樣每個工作站才能信任從其他工作站收到的結果。以工作為基礎的系統極難提供這類保證，因此幾乎不可能在這種系統上建構可靠的遠端執行系統。

Google 的分散式建構作業

自 2008 年起，Google 就開始使用分散式建構系統，同時採用遠端快取和遠端執行，如圖 3 所示。

圖 3. Google 的分散式建構系統

Google 的遠端快取稱為 ObjFS。這個系統由後端和前端組成，後端會將建構輸出內容儲存在 Bigtable 中，並分散到整個生產機器機群，前端則是在每部開發人員機器上執行的 FUSE 精靈，名為 objfsd。工程師可透過 FUSE 精靈瀏覽建構輸出內容，就像瀏覽儲存在工作站上的正常檔案一樣，但只有使用者直接要求的少數檔案，才會視需要下載檔案內容。視需要提供檔案內容可大幅減少網路和磁碟用量，與將所有建構輸出內容儲存在開發人員本機磁碟的情況相比，系統建構速度可提升一倍。

Google 的遠端執行系統稱為 Forge。Blaze (Bazel 的內部對等項目) 中的 Forge 用戶端會呼叫 Distributor，將每個動作的要求傳送至資料中心執行的作業 (稱為「排程器」)。排程器會維護動作結果的快取，因此如果系統的其他使用者已建立動作，排程器就能立即傳回回應。如果沒有，系統會將動作放入佇列。大量的執行器作業會持續從這個佇列讀取動作、執行動作，並將結果直接儲存在 ObjFS Bigtable 中。執行人員可使用這些結果執行後續動作，或由使用者透過 objfsd 下載。

最終成果是可擴充的系統，能有效支援 Google 執行的所有建構作業。Google 的建構作業規模非常龐大：Google 每天會執行數百萬次建構作業，執行數百萬個測試案例，並從數十億行的原始碼產生數千兆位元組的建構輸出內容。這類系統不僅能讓工程師快速建構複雜的程式碼集，還能實作大量依賴建構作業的自動化工具和系統。

分散式版本 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

遠端快取

遠端執行

Google 的分散式建構作業

分散式版本