葫芦岛仓确电子商务有限公司

RELATEED CONSULTING
相關咨詢
選擇下列產品馬上在線溝通
服務時間:8:30-18:00
你可能遇到了下面的問題
高端網頁設計

當前位置:木辰建站->新聞資訊

與阿里云攜手合作,百家云三天擴容數十倍

  • 作者:騰曦網絡
  • 發表時間:2020-03-09 15:49:28
  • 來源:shmuchen.com
  • 瀏覽量:3140

  由于疫情的肆虐,原本該回歸各大校園的師生們涌入線上,突如其來的流量洪峰給在線教育行業迎來了極大挑戰。目前已有2億學生在線上課。

  長期服務教育企業的百家云也不例外。在疫情期間,百家云-作為一家致力于為教育機構提供一站式云課堂解決方案的企業,接到來自多家教育機構搭建在線云課堂的需求,同時原來以線下為主的教育機構流量瞬間轉到了線上。

  為了響應教育部門停課不停學的號召,幫助學生老師們開學,百家云全體員工縮短了假期,從大年初二開始在家辦公,初七開始全員辦公。

  短時間內爆發式的需求,對于每一家教育企業而都是始料未及的。據百家云CEO李鋼江透露,百家云的業務量短時間內增長了數十倍。如此迅速的擴容需要,還要在客戶無感知的情況下完成,比交付一個新系統難度更大。

  不幸中的萬幸是,百家云團隊對敏捷架構的探索讓他們在如此高并發場景上早有準備。這場戰役之前,百家云已在阿里云團隊的幫助下,優化自身容器集群架構與規劃,通過以阿里云容器服務ACK、彈性裸金屬(神龍)實例的核心方案,從容實現動態擴容與高效管控。

服務器

  一、探索容器化改造,具備應對洪峰敏捷能力

  百家云非常幸運,在這輪爆發之前完成了容器化改造。其他沒有使用容器的在線教育企業,面對暴漲的用戶,只能成倍堆積機器,導致部署時間拉長,業務成本劇烈升高。

  百家云從2017年誕生之初就是在做直播大班課產品,是行業內擁有最純正的教育基因的云視頻公司。在2018年已經實現了過億營收,服務了超過1000多家教育企業。

  隨著業務高速增長,促使百家云技術團隊探索自身技術架構的優化。到了2019年,百家云逐步推出小班課產品,該產品的處理方式與大班課不同,需要通過音視頻抓屏的方式,將課程錄制下來回放。此過程中,還需要將音頻與視頻進行隔離。用虛擬機級別的隔離成本太高;若跑在統一虛擬機里,各個進程則會互相干擾。百家云團隊于是關注到了容器這種更為輕量級的虛擬化技術。

  在2019年上半年開始,百家云內部就開始嘗試小規模對業務進行容器化改造,完成了基本流程的跑通。

  然而,隨著百家云容器規模的擴大,調度與管理成為了新的問題。阿里云的容器管理平臺(ACK,AlibabaCloudContainerServiceforKubernetes),大大減少百家云的工作。百家的技術團隊表示,容器減少了運維和測試的工作量;方便了對應用運行環境實現版本控制;且相比虛擬機有著更小計算開銷,降低了IT成本。

  彼時基于容器的云原生大潮已然席卷,基于容器技術的云原生架構,為百家云可能出現的業務峰值做了敏捷彈性的技術儲備。

  只是,這還是第一步。

  瞬間來臨的洪峰,還是給百家云帶來了考驗。瞬間來臨的洪峰,還是給百家云帶來了考驗。

  二、借助阿里云“容器+神龍”,三天內實現數十倍擴容

  疫情是全國共同的敵人。業務持續穩定增長的百家云,未曾料想到新禧之年將面臨這樣一場“戰役”,原來容器集群的許多配置沒有按大規模集群去規劃,導致單個集群可容納的節點受限,原來使用的小規格實例也限制了單個節點的容量。潮水襲來,百家云的問題很直接:擴容。

  針對百家云的擴容問題,阿里云團隊建議客戶選用大規格的彈性裸金屬服務器(神龍)。根據百家云的應用負載特點,結合容器服務管控合適規格的彈性裸金屬實例來優化成本、避免浪費,提升彈性供給保障。

  首先,阿里云彈性裸金屬服務器(神龍)服務器的規格較高,可以幫助百家云顯著提升了單個節點的容量。

  更重要的是,百家云的K8s集群對性能要求極高。神龍服務器的性能優勢明顯,“容器+彈性裸金屬(神龍)”的解決方案非常契合百家云大流量、高并發的場景。基于容器化構建方式,可以滿足業務快速發放和彈性的要求。神龍服務器完全消除了虛擬化損耗,提升了8%的計算性能,其類物理機特性,可進行二次虛擬化。神龍的性能,加上容器的彈性,形成了天作之合。數據顯示,容器運行在云上神龍反而比非云物理機的性能要好10%-15%。主要是因為虛擬化開銷已經offload到MOC卡上,神龍的CPU/Mem是無虛擬化開銷的,而上云后運行在神龍上的每個容器都獨享ENI彈性網卡,能提升13%的網絡吞吐量。

  第三,神龍服務器是存儲帶寬+計算帶寬是分離,能滿足百家云的業務場景的大量讀寫需求。使用神龍服務器之后,計算能力大增,但是同時也遇到了存儲I/O性能瓶頸的問題。百家云通過使用阿里云的高性能NAS服務,并通過水平擴展為4個集群,解決了I/O的瓶頸。

  基于以上方案,借助自身的大規模集群管理能力,在短短幾天之內,阿里云團隊幫助百家云團隊有效升級了原有的架構方案,實現了數十倍的擴容,大幅提升了其性能與穩定性,并擁有了應對爆發性規模的能力。

服務器

  三、優化架構與集群規劃,顯著降低運維成本

  面對突增流量壓力,如何迅速動態彈性擴容以及高效管控運維成為迫切問題。

  改變了原來虛擬化嵌套的形式,百家云利用神龍實現了容器的高密度部署。配合容器的敏捷管理能力,起碼節省了25%的成本,降低了80%的運維工作量。同時,合理規劃K8s集群,優化整體架構如網絡、存儲方案、擴容原則,確保后續運維的穩定性并降低使用成本。

  此外,百家云還使用了阿里云高效運維管理的工具,顯著降低了運維工作量。

  由于百家云業務上容器的時間非常緊迫,根本沒有多少時間可以花在運維監控上。通過使用ARMSPrometheus,僅僅半小時百家云就實現了容器節點環境的監控。相比開源Prometheus監控,ARMSPrometheus的數據量無上限且與阿里云容器服務ACK無縫對接,讓百家云在容器里高效快速定位問題,了解可如何改善自己的產品。

  阿里云容器平臺的日志服務(SLS)里中小應用事件中心,詳細展示了集群的狀態變更和組件異常等事件,幫助百家云把節點里面日志的異常信息匯總到控制面板,及時告警。

  李鋼江總結,阿里云帶給百家云的價值主要是以下三點:

  1、提供了彈性計算的空間與敏捷安全的擴容能力

阿里云對應用鏡像進行了鏡像預熱等手段,在擴容時可第一時間拉起容器?;谌萜麋R像服務ACR安全托管大規模容器鏡像資產,通過細粒度的鏡像授權管控,安全快速地對應用鏡像進行全生命周期管理。

  2、提供了相對穩定的服務與優異性能

基于阿里云自研的神龍軟硬一體架構,彈性裸金屬服務器(神龍)有著物理機的性能和虛擬機的使用體驗。通過利用神龍,百家云實現更好地調度K8s集群,加上高性能NAS服務,解決了I/O瓶頸問題。

  3、技術支持團隊響應及時,幫助百家云優化架構

百家云之所以后來面臨擴容問題,部分源于其原來業務架構規劃未做好管理大規模集群的準備,阿里云幫助了百家云在短時間內優化了業務架構,優化集群的管理能力。

  阿里云作為全國第一、世界頂尖的云服務商,在IaaS和PaaS層能力強大;百家云在教育SaaS層的積累,可以與阿里云互補,一同以完整的在線教育方案去覆蓋市場。雙方正在逐步深化合作,百家云將很快上線阿里云云市場——阿里云SaaS加速器的商業平臺,即“軟件天貓”,后續用戶可直接在云市場選購百家云的服務。





聲明:本文由 騰曦網絡 收集整理的《與阿里云攜手合作,百家云三天擴容數十倍》,如轉載請保留鏈接:http://www.llqzw.com.cn/news_in/161

上一篇新聞:服務器內存需求增加,服務器內存大漲20%

下一篇新聞:什么是偽靜態?偽靜態有何作用?哪種好?

收縮