Shoal框架重塑Aptos共識 優化Bullshark延遲降低40%

Shoal框架:減少Aptos上Bullshark延遲的新方法

Aptos labs最近解決了DAG BFT中兩個重要的開放問題,顯著減少了延遲,並首次消除了確定性實際協議中對超時的需求。總體而言,在無故障情況下Bullshark的延遲改進了40%,在故障情況下改進了80%。

Shoal是一個框架,通過流水線和領導者聲譽機制增強基於Narwhal的共識協議(如DAG-Rider、Tusk、Bullshark)。流水線通過每輪引入一個錨點來減少DAG排序延遲,領導者聲譽通過確保錨點與最快的驗證節點相關聯來進一步改善延遲問題。此外,領導者聲譽使Shoal可以利用異步DAG構造來消除所有場景中的超時。這使Shoal具備了普遍響應性,包含了通常需要的樂觀響應。

Shoal的技術相對簡單,涉及按順序運行底層協議的多個實例。當使用Bullshark實例化時,就像一羣進行接力賽的"鯊魚"。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

背景與動機

在追求區塊鏈網路高性能時,降低通信復雜性一直是關注重點。然而,這種方法並未帶來顯著的吞吐量提升。例如,Diem早期版本中實現的Hotstuff僅達到3500 TPS,遠低於100k+ TPS的目標。

近期的突破源於認識到數據傳播是基於領導者協議的主要瓶頸,可以從並行化中受益。Narwhal系統將數據傳播與核心共識邏輯分離,提出了一種所有驗證者同時傳播數據的架構,共識組件僅訂購少量元數據。Narwhal論文報告了160,000 TPS的吞吐量。

之前我們介紹了Quorum Store,即Narwhal的實現,將數據傳播與共識分離,以及如何用它來擴展當前的共識協議Jolteon。Jolteon是一種基於領導者的協議,結合了Tendermint的線性快速路徑和PBFT風格的視圖更改,可將Hotstuff延遲降低33%。然而,基於領導者的共識協議無法充分利用Narwhal的吞吐量潛力。

因此,我們決定在Narwhal DAG之上部署Bullshark,一種零通信開銷的共識協議。不過,與Jolteon相比,支持Bullshark高吞吐量的DAG結構帶來了50%的延遲成本。

本文介紹了Shoal如何大幅減少Bullshark延遲。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

DAG-BFT背景

Narwhal DAG中的每個頂點都與一個輪數相關。爲進入第r輪,驗證者必須先獲得第r-1輪的n-f個頂點。每個驗證者每輪可廣播一個頂點,每個頂點至少引用前一輪的n-f個頂點。由於網路異步性,不同驗證者可能在任何時間點觀察到DAG的不同本地視圖。

DAG的一個關鍵屬性是非模糊性:如果兩個驗證節點在其DAG本地視圖中具有相同的頂點v,那麼它們具有完全相同的v因果歷史。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

總序

可以在無額外通信開銷的情況下就DAG中所有頂點的總順序達成一致。爲此,DAG-Rider、Tusk和Bullshark中的驗證者將DAG結構解釋爲一種共識協議,其中頂點代表提案,邊代表投票。

雖然DAG結構上的羣體交集邏輯不同,但所有現有基於Narwhal的共識協議都具有以下結構:

  1. 預定錨點:每隔幾輪就有一個預先確定的領導者,其頂點稱爲錨點。

  2. 排序錨點:驗證者獨立但確定性地決定訂購哪些錨點以及跳過哪些錨點。

  3. 排序因果歷史:驗證者逐個處理有序錨點列表,對每個錨點的因果歷史中先前無序的頂點進行排序。

滿足安全性的關鍵是確保在步驟2中,所有誠實驗證節點創建的有序錨點列表共享相同的前綴。在Shoal中,我們對上述所有協議做出以下觀察:

所有驗證者都同意第一個有序的錨點。

Bullshark延遲

Bullshark的延遲取決於DAG中有序錨點之間的輪數。雖然Bullshark最實用的部分同步版本比異步版本延遲更低,但仍遠非最優。

問題1:平均塊延遲。在Bullshark中,每個偶數輪都有一個錨點,每個奇數輪的頂點被解釋爲投票。常見情況下,需要兩輪DAG才能訂購錨點,然而,錨點因果歷史中的頂點需要更多輪次等待錨點被排序。通常情況下,奇數輪中的頂點需要三輪,而偶數輪中的非錨點頂點需要四輪。

問題2:故障情況延遲。如果一輪的領導者未能足夠快地廣播錨點,則無法對錨點進行排序(因此被跳過),前幾輪中所有未排序的頂點必須等待下一個錨點被排序。這會顯著降低地理復制網路的性能,尤其是因爲Bullshark使用超時等待領導者。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

Shoal框架

Shoal通過流水線增強了Bullshark(或任何其他基於Narwhal的BFT協議),允許每輪都有一個錨點,並將DAG中所有非錨點頂點的延遲減少到三輪。Shoal還在DAG中引入了零開銷領導者聲譽機制,使選擇偏向於快速領導者。

挑戰

在DAG協議背景下,流水線和領導者聲譽被認爲是困難的問題,原因如下:

  1. 之前的流水線嘗試修改核心Bullshark邏輯,但這本質上似乎不可能。

  2. 領導者聲譽在DiemBFT中引入並在Carousel中正式化,是根據驗證者過去表現動態選擇未來領導者(Bullshark中的錨點)的想法。雖然在領導者身分上存在分歧不違反這些協議的安全性,但在Bullshark中可能導致完全不同的排序,這引出了問題的核心:動態和確定性地選擇輪錨是解決共識所必需的,而驗證者需要就有序歷史達成一致以選擇未來的錨點。

作爲問題難度的證據,Bullshark的實現(包括目前生產環境中的實現)都不支持這些特性。

協議

盡管存在上述挑戰,但解決方案隱藏在簡單之中。

在Shoal中,我們依靠在DAG上執行本地計算的能力,實現了保存和重新解釋前幾輪信息的能力。憑藉所有驗證者都同意第一個有序錨點的核心洞察,Shoal按順序組合多個Bullshark實例進行流水線處理,使得(1)第一個有序錨點是實例的切換點,以及(2)錨點的因果歷史用於計算領導者的聲譽。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

流水線

與Bullshark類似,驗證者先驗地就潛在的錨點達成一致,即有一個已知的映射F:R -> V將輪次映射到領導者。Shoal一個接一個地運行Bullshark的實例,對於每個實例,錨點由映射F預先確定。每個實例都訂購一個錨點,這會觸發切換到下一個實例。

最初,Shoal在DAG的第一輪啓動Bullshark的第一個實例並運行它直到確定第一個有序錨點,比如在第r輪。所有驗證者都同意這個錨點。因此,所有驗證者都可以確定性地同意從第r+1輪開始重新解釋DAG。Shoal只是在第r+1輪啓動了一個新的Bullshark實例。

在最佳情況下,這允許Shoal在每輪都訂購一個錨點。第一輪的錨點由第一個實例排序。然後,Shoal在第二輪開始一個新實例,它本身有一個錨點,該錨點由該實例排序,然後,另一個新實例在第三輪中訂購錨點,以此類推。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

領導者聲譽

當Bullshark排序期間跳過錨點時,延遲會增加。在這種情況下,流水線技術無能爲力,因爲在前一個實例訂購錨點之前無法啓動新實例。Shoal通過使用聲譽機制根據每個驗證節點最近活動的歷史爲每個驗證節點分配一個分數來確保將來不太可能選擇相應的領導者來處理丟失的錨點。響應並參與協議的驗證者將獲得高分,否則,驗證節點將被分配低分,因爲它可能崩潰、緩慢或作惡。

其理念是在每次分數更新時,確定性地重新計算從輪次到領導者的預定義映射F,偏向於得分較高的領導者。爲了讓驗證者在新的映射上達成一致,他們應該在分數上達成一致,從而在用於派生分數的歷史上達成一致。

在Shoal中,流水線和領導聲譽可以自然結合,因爲它們都使用相同的核心技術,即在就第一個有序錨點達成一致後重新解釋DAG。

事實上,唯一的區別是,在第r輪中對錨點進行排序後,驗證者只需根據第r輪中有序錨點的因果歷史,從第r+1輪開始計算新的映射F'。然後,驗證節點從第r+1輪開始使用更新的錨點選擇函數F'執行Bullshark的新實例。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

不再需要超時

超時在所有基於領導者的確定性部分同步BFT實現中起着至關重要的作用。然而,它們引入的復雜性增加了需要管理和觀察的內部狀態數量,這增加了調試過程的復雜性,並且需要更多的可觀察性技術。

超時也會顯著增加延遲,因爲適當配置它們非常重要,通常需要動態調整,因爲它高度依賴於環境(網路)。在轉移到下一個領導者之前,該協議會爲有故障的領導者支付完整的超時延遲懲罰。因此,超時設置不能過於保守,但如果超時時間太短,協議可能會跳過好的領導者。例如,我們觀察到,在高負載情況下,Jolteon/Hotstuff中的領導者不堪重負,並且在他們推動進展之前超時就已到期。

不幸的是,基於領導者的協議(如Hotstuff和Jolteon)本質上需要超時,以確保每次領導者出現故障時協議都能取得進展。如果沒有超時,即使是崩潰的領導者也可能永遠停止協議。由於在異步期間無法區分有故障的領導者和緩慢的領導者,超時可能會導致驗證節點在沒有共識活躍度的情況下查看更改所有領導者。

在Bullshark中,超時用

APT-3.17%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 分享
留言
0/400
DAO Therapyvip
· 07-29 08:08
Aptos技术真猛
回復0
MeltdownSurvivalistvip
· 07-28 17:57
前景太美好了
回復0
冲浪鲸鱼饲养员vip
· 07-28 17:54
突破惊人啊
回復0
薛定谔的Gas费vip
· 07-28 17:51
终于等到优化了
回復0
RegenRestorervip
· 07-28 17:36
优化效果挺惊人
回復0
破产艺术家vip
· 07-28 17:30
延迟终于有救了
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)