隨著互聯網SAAS產品日益增多,企業的SAAS運營能力逐步提升,服務可用度也一直在提升。過去的10年,SAAS行業剛剛起步,自動化運維能力比較弱,業務連續性低,故障恢復較慢。過去的5年,SAAS服務興起,各企業運營能力及自動化運維水平有了顯著提高,尤其是云服務的誕生,服務的可用度基本可以達到99.99%及以上。設計一個產品及模塊的高可用架構,除本身服務模塊支持入口數據流的負載或者主備模式及流控機制外,還需要考慮與模塊本身相關聯的服務,這些服務如果出現異常時,自身服務模塊能夠啟動哪些安全保護機制,確保業務能夠正常提供服務或者降級提供服務,這一點非常重要,因此,高可用性的設計需求需要先了解一下核心的業務模塊及每個模塊之間的關聯關系,再來決定高可用性架構的設計方法。

按照一定的標準將業務進行分級,挑選出核心的業務分級標準:訪問量大的、核心業務、產生大量收入的

對核心業務相關的數據進一步分析,識別所有的數據及數據特征常見數據特征分析緯度:數據量、數據唯一性、實時性、可丟失性、可恢復性

根據不同的數據設計不同的同步方案常見數據同步方案:存儲系統同步、消息隊列同步、重復生成
互聯網軟件行業仍在高速發展,創新型企業需求也不斷的發生變化,產品設計及運營面臨重大挑戰。一些特殊的業務架構設計及維護需要專業的核心團隊支撐,如何設計一個高可用性的架構服務仍是難點。為了抓住市場機會,除了擁有一個好的產品設計思想外,最關鍵的是如何提高產品運營的穩定性,如何確保產品變更服務及出現故障不會導致用戶掉線,做到用戶無感知呢?如何提高產品運營質量是每個廠商面臨的難題,也是提升產品運營核心競爭力之一。業務模塊高可用性設計有缺陷或者根本沒有高可用性,那么產品的質量一定存在問題,運營過程中必然會出現故障。

識別核心業務,優先實現核心業務的異地多活架構
物理距離導致無法實現數據快速同步的問題是無解的,只能盡量減少影響盡量減少機房距離、盡量減少數據同步、只保證最終一致性
多種手段配合存儲系統的同步來使用,或者不采用存儲系統的同步方案
靈活可配的告警策略,紙質動態基線告警、趨勢預測

支持模塊信息本地緩存功能,當網絡發生異常時,則仍然可以提供服務
支持主備冗余機制,當一臺模塊出現故障,業務能夠持續進行;
支持負載均衡機制,當一臺出現故障,故障節點自動摘除,業務能夠持續進行;
支持高并發限流機制,當并發超過指定閾值時,則啟動限流機制。