HDI小編介紹下,下面這個大卡車就是阿里2017在杭州的云棲大會發布的專有云。這個卡車號稱最大能力可以處理500萬TPS業務。

阿里云副總裁李津在現場演示了阿里云專有云斷電,我們從技術上角度來看看實現這個有多復雜(阿里沒有公布具體的實現,只能根據作者從業經驗推斷分析)。
講技術前,扯點其他的:
首先我覺得這個創意挺不錯,雖然有點類似AWS/Google。AWS 在2016 re:invent 就開了一輛卡車到大會主席臺,主要是可以幫助客戶一次性搬遷EB數據,相當于整個數據中心。阿里不完全一樣,是個私有云的概念。類似的數據中心集裝箱Google很早也提過。但是現場演示斷電還是首創,從參會的媒體的報道來看,還是引起了很多話題。

另外,從中可以看出,阿里已經決心進入私有云和專有云,去拓展大型客戶。以前阿里上客戶的互聯網、創新業務比較多。阿里積累到一定程度之后,進入中大型客戶,賺取更高額的利潤的決心變大。要做到這一點,當能需要滿足中大型客戶的訴求,可掌控,夠安全,夠穩定。
下面回到這次演練來,演練選取一個模擬的比較簡單的業務,記錄跑步者的各項數據(心跳,速度等等),排名顯示在大屏幕上,一共涉及四個服務SLB、RDS、ECS、OSS,演示的內容就是斷掉其中的一個柜服務器(從演示來看,一共是6個柜,每個柜8臺服務)業務不受影響,來體現災備能力。

實事求是的說,做一個可靠的專有云還是有不少工作要做的,從硬件到軟件都要考慮相應的冗余災備設計。比如服務器本身要雙電源,網絡要冗余,上層基礎軟件要能自動切換,相關告警檢測能力都需要有。
不過這次演示的業務比較簡單,直接斷掉一框服務,考驗的主要是服務的業務切換能力。涉及的幾個服務SLB、RDS、OSS本身都是有分布式能力,ECS上裝應用,應用也比較簡單,主要就是個顯示展現,可以直接無狀態分布。
SLB:負載均衡,負責將業務分發到有處理的能力的服務器;本身一般是主備容災。
RDS:通過多實例分布式部署,數據庫自動同步能力。每個跑步者的數據是相互獨立的,一個實例掛了之后,其他實例接管業務。
OSS:對象存儲本身都是分布式多份冗余。
ECS:應用無狀態分布,數據都存在RDS里面。跑步者的數據出錯,進行重傳和重連即可。
總的來說,業務很簡單,演示的技術也都是成熟技術。

通訊手機HDI
通訊手機HDI
通訊模塊HDI