為什么任何時(shí)間都可以登錄淘寶,淘寶不需要維護(hù)服務(wù)器嗎?:首先來(lái)說(shuō),服務(wù)器本身也是屬于耗材,長(zhǎng)時(shí)間的運(yùn)行、設(shè)備升級(jí)更換、系統(tǒng)升級(jí)等情況下,是需要停機(jī)維護(hù)
首先來(lái)說(shuō),服務(wù)器本身也是屬于耗材,長(zhǎng)時(shí)間的運(yùn)行、設(shè)備升級(jí)更換、系統(tǒng)升級(jí)等情況下,是需要停機(jī)維護(hù)的。
現(xiàn)實(shí)中,我們很少看見(jiàn)淘寶網(wǎng)、騰訊等這些大型互聯(lián)網(wǎng)站打不開(kāi)的情況,很多人就心生疑問(wèn),它們的服務(wù)器都不需要維護(hù)嗎?其實(shí)是需要維護(hù)的。
這樣說(shuō)吧,淘寶網(wǎng)服務(wù)器很多,沒(méi)人知道其具體數(shù)字。但從網(wǎng)絡(luò)上的資料來(lái)看,淘寶宣稱雙11當(dāng)天每小時(shí)擴(kuò)容10W臺(tái)服務(wù)器,足見(jiàn)其服務(wù)器規(guī)模的龐大了。
這么多的服務(wù)器,它們會(huì)以集群的形式來(lái)部署,同時(shí)淘寶網(wǎng)也是分布式的。假設(shè)它有10臺(tái)服務(wù)器,當(dāng)其中一部分需要維護(hù)升級(jí)時(shí),可以直接停機(jī)維護(hù),對(duì)于整個(gè)集群而言就是少了一個(gè)節(jié)點(diǎn)而以,還有其余9個(gè)節(jié)點(diǎn)可以為用戶提供服務(wù)。所以對(duì)于用戶而言,是沒(méi)有感知的!
集群有很多優(yōu)點(diǎn),其中之一就是高可用性。像淘寶網(wǎng)這類的網(wǎng)站都是聲稱全年可用率達(dá)99.9%以上,加上其后端服務(wù)器規(guī)模的龐大,一部分服務(wù)器節(jié)點(diǎn)需要停機(jī)時(shí),對(duì)整體網(wǎng)站的穩(wěn)定性不會(huì)產(chǎn)生影響。
“極客談科技”,全新視角、全新思路,伴你遨游神奇的科技世界。
任何時(shí)間都可以登錄淘寶網(wǎng)站與淘寶服務(wù)器維護(hù)之間并不存在任何沖突。
服務(wù)器無(wú)論是從硬件的擴(kuò)容、例行的維護(hù)檢查、損壞硬件設(shè)備的更換等方面均需要進(jìn)行維護(hù)。根據(jù)服務(wù)器運(yùn)行等級(jí)的不同,維護(hù)的級(jí)別也就不同。重要領(lǐng)域的服務(wù)器維護(hù)并不允許中斷其業(yè)務(wù),例如金融系統(tǒng)服務(wù)器的維護(hù),往往中斷一次需要向省級(jí)管理機(jī)構(gòu)進(jìn)行申請(qǐng)。淘寶服務(wù)器的維護(hù)同樣如此,并不會(huì)輕易允許中斷用戶的訪問(wèn)。
那么,一起來(lái)看看淘寶服務(wù)器究竟是如何實(shí)現(xiàn)訪問(wèn)無(wú)干擾前提下的維護(hù)吧!
一、淘寶服務(wù)器搭建的框架基礎(chǔ)
淘寶的阿里云作為國(guó)內(nèi)最大的云服務(wù)器廠商,自家產(chǎn)品的服務(wù)器怎能落下。淘寶依靠大量的服務(wù)器集群構(gòu)建的云服務(wù)器,系統(tǒng)并不單單依靠一臺(tái)服務(wù)器,而是整個(gè)服務(wù)器所建立起來(lái)的虛擬云空間。服務(wù)器集群的部分硬件維護(hù)并不會(huì)影響其業(yè)務(wù)網(wǎng)站的正常訪問(wèn),只是性能有所下降而已,后面將會(huì)談到該問(wèn)題。
二、淘寶服務(wù)器的冗余備份
無(wú)論是網(wǎng)絡(luò)、服務(wù)器設(shè)備的冗余備份很重要。對(duì)于阿里巴巴來(lái)說(shuō)同樣如此,冗余備份并非指的是雙服務(wù)器備份這么簡(jiǎn)單,級(jí)別較高的需要使用異地備份。也就是說(shuō),在不同的地市、不同的數(shù)據(jù)機(jī)房均會(huì)建立淘寶的云服務(wù)器。這樣可以避免突發(fā)情況,導(dǎo)致的業(yè)務(wù)不可恢復(fù)的問(wèn)題。淘寶涉及用戶量較大,不僅僅是服務(wù)器維護(hù)的問(wèn)題,用戶數(shù)據(jù)的安全性同等重要。
即便局部城市服務(wù)器中斷維護(hù),對(duì)其網(wǎng)站的正常訪問(wèn)也不會(huì)造成影響。
三、淘寶服務(wù)器的維護(hù)時(shí)間段
前面兩點(diǎn)已經(jīng)提到,服務(wù)器的正常維護(hù)并不會(huì)影響網(wǎng)站的正常訪問(wèn),但是會(huì)導(dǎo)致訪問(wèn)時(shí)服務(wù)器處理性能的下降。這點(diǎn)很容易理解,畢竟接入的服務(wù)器數(shù)量降低,計(jì)算能力有所下降。這與雙十一用戶激增,服務(wù)運(yùn)行緩慢是一個(gè)道理。那么,服務(wù)器維護(hù)時(shí)間的選擇就較為重要。一般是選擇用戶訪問(wèn)量較小的時(shí)間段進(jìn)行維護(hù),通常是凌晨。
如果涉及的維護(hù)工作較為復(fù)雜,影響范圍較廣,通常會(huì)發(fā)布服務(wù)器維護(hù)的公告。
關(guān)于淘寶服務(wù)器維護(hù)卻不會(huì)中斷用戶業(yè)務(wù)的事情,您怎么看?
歡迎大家留言討論,喜歡的點(diǎn)點(diǎn)關(guān)注。
1.淘寶有幾十萬(wàn)臺(tái)服務(wù)器,就好像人有好多細(xì)胞一樣,其他細(xì)胞的死亡不會(huì)影響人類的生命。
2.淘寶的服務(wù)器是集群的,都由中央主機(jī)來(lái)控制。就好像一張大網(wǎng),如果有哪一個(gè)網(wǎng)格開(kāi)線了,只要修補(bǔ)一下,是不影響正常服務(wù)的。
3.一般正常點(diǎn)的服務(wù)器會(huì)做到數(shù)據(jù)硬盤red0,就是說(shuō)一個(gè)數(shù)據(jù)盤壞了,另外一個(gè)盤立馬頂上,服務(wù)還可以進(jìn)行,當(dāng)然那個(gè)壞盤會(huì)在最快的時(shí)間報(bào)警工作人員會(huì)替換下來(lái),而這個(gè)硬盤會(huì)直接粉碎,以防數(shù)據(jù)泄露,但阿里的服務(wù)器數(shù)據(jù)盤肯定在red0以上,有好幾個(gè)數(shù)據(jù)組硬盤,一組壞了另外一組可以頂上。
4.有人說(shuō)了,那如果一臺(tái)主要服務(wù)器癱瘓了,就算硬盤沒(méi)壞也停止服務(wù)了,理論上是這樣的,但是服務(wù)器也可以增加備份機(jī),行話叫做雙機(jī)熱備,意思就是說(shuō),兩臺(tái)甚至兩臺(tái)以上的服務(wù)器,同步儲(chǔ)存一個(gè)內(nèi)容,一樣的設(shè)置,如果其中一臺(tái)服務(wù)器在服務(wù)淘寶用戶賬戶數(shù)據(jù)管理的時(shí)候主板燒了,另外一臺(tái)會(huì)自動(dòng)跳轉(zhuǎn)到另外一臺(tái)備份服務(wù)器上,因?yàn)閮膳_(tái)服務(wù)器都是相同的內(nèi)容,所以就可以正常服務(wù)了,那臺(tái)壞的,維修好了,直接插到雙機(jī)熱備組里數(shù)據(jù)同步,所以你不會(huì)感覺(jué)到淘寶出問(wèn)題的,就好像打仗一樣,前邊的士兵倒了,后排的士兵補(bǔ)上。
5.綜上所述,數(shù)據(jù)盤多組備份加上服務(wù)器多組聯(lián)合預(yù)備服務(wù),就算一半服務(wù)器出現(xiàn)另外一半服務(wù)器都會(huì)頂上,維護(hù)只是把備份的機(jī)器拆下來(lái)維護(hù),所以你感覺(jué)不到,兩臺(tái)服務(wù)器那臺(tái)在用哪臺(tái)就是服務(wù)器,另外一臺(tái)就是備用同步,一臺(tái)壞掉,備用服務(wù)器就自動(dòng)成為主服務(wù)器。
2019年的雙11已經(jīng)過(guò)去,成交額達(dá)到了2684億。很多人可能會(huì)有這樣的想法“淘寶網(wǎng)難道不停機(jī)維護(hù)嗎?為什么任何時(shí)間都可以登陸淘寶呢?”下文具體說(shuō)一說(shuō)。
淘寶網(wǎng)的服務(wù)器很多,沒(méi)人知道具體的數(shù)字,從網(wǎng)上的資料來(lái)看,淘寶網(wǎng)聲稱雙11當(dāng)天,每小時(shí)擴(kuò)容10W臺(tái)服務(wù)器,足見(jiàn)其服務(wù)器規(guī)模的龐大了。
對(duì)網(wǎng)絡(luò)、服務(wù)器等設(shè)備來(lái)說(shuō),冗余很重要。對(duì)于阿里巴巴等這些大型互聯(lián)網(wǎng)公司來(lái)說(shuō),冗余備份并非是雙服務(wù)器那么簡(jiǎn)單,而是需要異地備份。也就是說(shuō)不同城市、不同的數(shù)據(jù)機(jī)房都會(huì)有淘寶的云服務(wù)器,避免突發(fā)情況。
可以說(shuō),淘寶的服務(wù)器分布再全國(guó)各地,某個(gè)地區(qū)的網(wǎng)絡(luò)中斷或者電力中斷,可以馬上跳轉(zhuǎn)到別的機(jī)房,不會(huì)影響其業(yè)務(wù),因?yàn)橛挟惖貍浞荨T诒WC正常使用的同時(shí),如果需要維護(hù)了,只需要停止一部分服務(wù)器就行了,然后進(jìn)行分批次維護(hù)。
除了考慮服務(wù)器的維護(hù)問(wèn)題外,還需要有安全保障。
大型互聯(lián)網(wǎng)公司的服務(wù)器,采用了集群的運(yùn)行方式,某個(gè)節(jié)點(diǎn)宕機(jī)或者停機(jī)維護(hù)都不會(huì)影響到業(yè)務(wù)的正常運(yùn)行。服務(wù)器放在機(jī)房里,服務(wù)器運(yùn)行需要網(wǎng)絡(luò)的電力的支持,網(wǎng)絡(luò)方面接入了電信、聯(lián)通、移動(dòng)的骨干網(wǎng),電力除了正常的工業(yè)用電外,還有UPS、發(fā)電機(jī)等設(shè)備,保證設(shè)備的正常運(yùn)行。
總之,淘寶等這些互聯(lián)網(wǎng)公司的服務(wù)器需要維護(hù),由于服務(wù)器數(shù)量眾多,采用了集群的工作方式。維護(hù)時(shí),只需要停止一部分服務(wù)器就行了,然后進(jìn)行分批維護(hù)。
如果覺(jué)得對(duì)你有幫助,可以多多點(diǎn)贊哦,也可以隨手點(diǎn)個(gè)關(guān)注哦,謝謝。
人可以兩班倒,服務(wù)器當(dāng)然也可以啊……那些升級(jí)維護(hù)需要停機(jī)的,只有一個(gè)原因,就是窮
感謝您的閱讀!
2019年天貓雙11,每秒訂單峰值54.4萬(wàn)筆,這么龐大的數(shù)據(jù)流量,阿里巴巴核心系統(tǒng)100%上云,它抗住了。下圖似乎更能證明,阿里巴巴在服務(wù)器方面的優(yōu)勢(shì)。
從2009年,400筆/秒,到2019年,54.4萬(wàn)筆/秒,可以說(shuō)阿里巴巴十年的進(jìn)步。其實(shí),我們現(xiàn)在可以慢慢回答這個(gè)問(wèn)題,淘寶需要維護(hù)服務(wù)器嗎?
了解第一個(gè)詞:服務(wù)器集群。
所謂的服務(wù)器集群,指的是眾多服務(wù)器集中起來(lái)一起進(jìn)行同一種服務(wù),因此它們能夠在一起提供更好,更高的計(jì)算速度,從而帶來(lái)系統(tǒng)的運(yùn)行正常。
而服務(wù)器集群最大的好處是,能夠在某一臺(tái)服務(wù)器進(jìn)行故障的時(shí)候,集群也在工作,并且接管共享磁盤柜上的數(shù)據(jù)區(qū),進(jìn)而使應(yīng)用重新正常運(yùn)轉(zhuǎn),它可以平衡服務(wù)器負(fù)荷、卸載服務(wù)器,從而讓我們更好的進(jìn)行維護(hù)。
而且一般維護(hù)服務(wù)器的時(shí)候,時(shí)間段選擇也很重要,自然不會(huì)選擇流量巨大的高峰期,比如雙十一等等,一般選擇在凌晨,流量比較少的時(shí)間段。
了解第二個(gè)詞:公共云
在2019年3月21日,2019阿里云峰會(huì)·北京站上,阿里云表示,整個(gè)阿里經(jīng)濟(jì)體正在All In Cloud,成為“云上的阿里巴巴”!
可以說(shuō),公共云已經(jīng)成為了阿里巴巴的核心,即使在2018年,還是在使用神龍服務(wù)器,在2019年,大約9月份左右,阿里巴巴就將數(shù)以萬(wàn)計(jì)的物理服務(wù)器轉(zhuǎn)移到云端,而如今阿里巴巴是將首個(gè)交易核心放在了云上,這就為未來(lái)的服務(wù)器的維護(hù)以及應(yīng)對(duì)像雙11這樣大流量奠定了基礎(chǔ),阿里云已經(jīng)有能力,應(yīng)對(duì)復(fù)雜的流量激增等問(wèn)題。
這只是一個(gè)簡(jiǎn)單的技術(shù)…一般服務(wù)器如果不遇到特殊問(wèn)題是會(huì)一直處于運(yùn)行狀態(tài)的,而如果出現(xiàn)了問(wèn)題或者有了新功能的話我們需要停機(jī)部署服務(wù)。這個(gè)時(shí)候就會(huì)出現(xiàn)一個(gè)時(shí)間空擋。像我們公司用的nginx做負(fù)載均衡,只需要有兩臺(tái)服務(wù)器就可以保證在一臺(tái)服務(wù)器部署或者宕機(jī)情況下把所有用戶請(qǐng)求轉(zhuǎn)發(fā)到另一臺(tái)服務(wù)器,更別說(shuō)阿里這樣的大企業(yè)了??
我的工作就是做電子商務(wù)系統(tǒng)維護(hù),我來(lái)回答一下這個(gè)問(wèn)題。任何服務(wù)器都需要維護(hù),但是可以做到在用戶無(wú)感知的狀態(tài)下進(jìn)行維護(hù)。
諸如銀行網(wǎng)銀、電子商務(wù)等涉及到互聯(lián)網(wǎng)服務(wù)的項(xiàng)目現(xiàn)在都能夠做到7*24小時(shí)提供服務(wù)。實(shí)現(xiàn)這個(gè)目標(biāo)主要依靠以下幾個(gè)方面:
我們?cè)诳蛻舳耍ňW(wǎng)頁(yè)瀏覽器或者手機(jī)app)進(jìn)行瀏覽時(shí)訪問(wèn)的不僅僅只有一個(gè)服務(wù)器,小的網(wǎng)站3、5臺(tái),大型的如淘寶估計(jì)就有數(shù)不清的服務(wù)器了,每一個(gè)向客戶端提供的服務(wù)都由多臺(tái)服務(wù)器同時(shí)提供,如果其中一個(gè)服務(wù)器宕機(jī)了,則用戶會(huì)自動(dòng)訪問(wèn)到其他的服務(wù)器上,而且所有的服務(wù)器都分布在不同的機(jī)房里面,即便是某個(gè)機(jī)房斷電斷網(wǎng)了,也可以保證其他機(jī)房能夠持續(xù)的提供服務(wù),保證了后臺(tái)服務(wù)的高可用。
分布式服務(wù)指的是一個(gè)系統(tǒng)的所有服務(wù)并不一定由一臺(tái)服務(wù)器或者一個(gè)程序完全提供,我們可以根據(jù)職責(zé)的不同將服務(wù)進(jìn)行歸類劃分(比如把需要高度運(yùn)算的服務(wù)放在一起,把需要訪問(wèn)數(shù)據(jù)層的服務(wù)放在一起),也可以按服務(wù)功能的不同將服務(wù)進(jìn)行歸類劃分(比如把用戶中心獨(dú)立成為服務(wù),把訂單獨(dú)立成為服務(wù))。分布式服務(wù)架構(gòu)對(duì)于系統(tǒng)穩(wěn)定性的好處就在于倘若部分服務(wù)出現(xiàn)異常情況也不會(huì)影響到系統(tǒng)其他職責(zé)的服務(wù)(比如訂單服務(wù)掛了,但是我們?nèi)匀豢梢哉TL問(wèn)用戶中心)。
無(wú)論是服務(wù)器集群也好,分布式服務(wù)架構(gòu)也好,總歸是要有人去維護(hù)和管理。目前再高度自動(dòng)化的運(yùn)維依然需要人為介入,這就是運(yùn)維工程師的職責(zé)。
綜上所述,我們的運(yùn)維工程師可以采取分批維護(hù)、升級(jí)、重啟部分服務(wù)器的方式,對(duì)系統(tǒng)進(jìn)行用戶無(wú)感知的維護(hù)。
我是程序員愛(ài)編程,一個(gè)資深非專業(yè)碼農(nóng),科技領(lǐng)域段子手!如本回答能夠討得您的歡心,勞請(qǐng)點(diǎn)贊、轉(zhuǎn)發(fā)、關(guān)注我,如有不同看法可以在評(píng)論區(qū)留言,謝謝!
阿里的技術(shù)在國(guó)內(nèi)也算是數(shù)一數(shù)二的了,所以我們?nèi)魏螘r(shí)候都可以登錄淘寶,但淘寶的服務(wù)器也是需要維護(hù)的,只不過(guò)我們只是站在使用者的角度去訪問(wèn)淘寶服務(wù)器,而后端服務(wù)方面卻處理的毫無(wú)痕跡,而用戶是根本感知不到它在何時(shí)做了維護(hù)。
記得有一次演講中介紹到,現(xiàn)在阿里可以做到僅用一秒鐘即可完服務(wù)器遷移,而且因?yàn)榘⒗飺碛写罅康姆⻊?wù)器集群,可以分別在不同的時(shí)間段維護(hù)不同的服務(wù)器,這也不會(huì)影響到用戶的正常訪問(wèn)。所以,作為用戶來(lái)說(shuō),看到的結(jié)果就是任何時(shí)候都能訪問(wèn)淘寶。
所謂的服務(wù)器集群,簡(jiǎn)單來(lái)說(shuō)就是大量的服務(wù)器一起工作。用戶通過(guò)一個(gè)網(wǎng)址訪問(wèn)的時(shí)候,即使是某一個(gè)服務(wù)器掛掉了也不會(huì)影響到你的訪問(wèn),會(huì)有其他的服務(wù)器提供服務(wù),從而保證用戶可以正常登陸訪問(wèn)。就好比一個(gè)人穿衣服一樣,雖然穿在身上的只有一套,但肯定會(huì)有多套衣服存在的。如果不小心把衣服弄臟了、爛了,可以立即去換一套穿著出門。
關(guān)于服務(wù)器維護(hù)的時(shí)間問(wèn)題,這里也是有學(xué)問(wèn)的。盡管阿里有大量的服務(wù)器集群,但阿里的網(wǎng)站訪問(wèn)量也是非常之大的。在大數(shù)據(jù)方面,阿里是做的非常好的。各種數(shù)據(jù)都會(huì)有專門的數(shù)據(jù)報(bào)表,自然知道在什么時(shí)間段用戶的訪問(wèn)量是比較少的,所以,可以在訪問(wèn)量較低的時(shí)候?qū)Ψ⻊?wù)器進(jìn)行維護(hù)。
當(dāng)然,也并不是說(shuō)不會(huì)有大規(guī)模的服務(wù)器維護(hù)的情況出現(xiàn)。因?yàn)榘⒗锓⻊?wù)器上面所承載的服務(wù)太多了,比如淘寶、支付寶還有更多其他應(yīng)用,不管是應(yīng)用還是每個(gè)應(yīng)用的功能,其實(shí)也都是獨(dú)立的。一般出現(xiàn)大規(guī)模需要服務(wù)器維護(hù)的話,也是針對(duì)負(fù)責(zé)某一應(yīng)用的某個(gè)功能的服務(wù)器做大規(guī)模維護(hù)。一般出現(xiàn)這種情況的話就屬于比較大維護(hù),所以也都會(huì)提前有公告發(fā)出來(lái),會(huì)指定說(shuō)在什么時(shí)間段要做維護(hù)。
不過(guò)隨著技術(shù)的不斷升級(jí),像阿里這類財(cái)大氣粗的公司,基本可以實(shí)現(xiàn)永不宕機(jī),給用戶造成的就是阿里服務(wù)器不需要“維護(hù)”的假象。
服務(wù)器集群,即使有服務(wù)器掛了,備用服務(wù)器能立馬跑起來(lái),實(shí)現(xiàn)24小時(shí)無(wú)間斷允許,怕就怕光纜給人挖了
華裔女賭王就此沒(méi)落,生前讓所有 濃情端午粽飄香,青浦邀你“云體 上海:“云端”展現(xiàn)端午節(jié)文化內(nèi) “甜咸大戰(zhàn)”!明星藝人們喜歡什 如何做一個(gè)男人喜歡的情人(如何 當(dāng)你和你同時(shí)出現(xiàn)在同一個(gè)場(chǎng)景中 如何在昏暗的光線下設(shè)置快門速度 教育在生活中的價(jià)值是什么? 世上做壞事的人死后會(huì)面臨什么因 拜登就任總統(tǒng)后的第一步是什么? 同意/不同意:人生最重要的目標(biāo) 二戰(zhàn)后,德國(guó)在調(diào)和分歧方面做得 亞伯·林肯恨白人嗎? 一個(gè)編輯能把你的故事毀得有多嚴(yán) 現(xiàn)在的iPhone6還能堅(jiān)持再用一年 曹操為什么不殺司馬懿? 現(xiàn)在買房是不是最便宜的時(shí)候,現(xiàn) 我身邊的農(nóng)業(yè)銀行營(yíng)業(yè)廳關(guān)了,AT 歐洲媒體評(píng)選CBA最有實(shí)力球員, 榮耀play的6+128和榮耀8X的6+128 螞蟻集團(tuán)是科技公司還是金融公司 請(qǐng)問(wèn)機(jī)友華為mate30P與華為mate3 聽(tīng)說(shuō)老詹修剪一次指甲需要5小時(shí) 為什么說(shuō)寶寶“一月睡二月哭三月 戴笠人稱戴老板,這個(gè)是怎么叫出 沒(méi)有工作能一次性補(bǔ)繳社保么? 我想知道定向師范生和免費(fèi)師范生 肺癌引起的咳嗽是怎樣的呢? 5000mAh電池的5G手機(jī)推薦嗎?要 恒大亞冠表現(xiàn)“差強(qiáng)人意”,你覺(jué)