|
人為錯(cuò)誤導(dǎo)致微軟Azure停機(jī) 遠(yuǎn)程控制軟件,灰鴿子使用教程
1.jpg (39.95 KB, 下載次數(shù): 643)
下載附件
2014-12-18 11:09 上傳
事后分析確定差距在部署過(guò)程。灰鴿子下載
錯(cuò)誤執(zhí)行部署工程師和差距的政策背后的全球停機(jī)微軟Azure云平臺(tái)在今年11月,根據(jù)詳細(xì)的認(rèn)錯(cuò)分析軟件巨頭。
停機(jī)看到客戶(hù)在多個(gè)地區(qū)無(wú)法連接到多個(gè)服務(wù)如Azure存儲(chǔ)、虛擬機(jī),管理門(mén)戶(hù)網(wǎng)站,Active Directory和幾個(gè)小時(shí)。
最后一個(gè)根本原因分析(RCA)發(fā)表的Azure團(tuán)隊(duì)成員杰森詹德說(shuō)部署軟件的目的是改變以提高性能和減少處理器存儲(chǔ)表前端系統(tǒng)的利用率。
初始測(cè)試顯示,修復(fù)確實(shí)提高性能。但是當(dāng)軟件變更部署到Azure的生產(chǎn)環(huán)境中,然而,在兩個(gè)領(lǐng)域。
一位不愿透露姓名的工程師認(rèn)為,因?yàn)樾迯?fù)已經(jīng)被“飛行”的一部分Azure生產(chǎn)基礎(chǔ)設(shè)施,使它在其他云平臺(tái)將低風(fēng)險(xiǎn)。
微軟的標(biāo)準(zhǔn)政策逐步部署生產(chǎn)環(huán)境的變化在小片,但是配置工具沒(méi)有充分執(zhí)行。該公司將從現(xiàn)在開(kāi)始執(zhí)行這一政策本身在部署平臺(tái)。
第二個(gè)錯(cuò)誤導(dǎo)致軟件變更被錯(cuò)誤上啟用Azure Blob(二進(jìn)制大對(duì)象)存儲(chǔ)前端時(shí),只有經(jīng)過(guò)測(cè)試對(duì)表存儲(chǔ)前端。
這暴露了一個(gè)故障,致使一些Blob存儲(chǔ)前端被困在無(wú)限循環(huán),和停止響應(yīng)請(qǐng)求,詹德寫(xiě)道。
軟件變更已回滾之后,一些虛擬機(jī)在A(yíng)zure需要手動(dòng)恢復(fù)。這是由于磁盤(pán)掛載在啟動(dòng)超時(shí)錯(cuò)誤,在某些情況下引起的高負(fù)載的存儲(chǔ)服務(wù)在經(jīng)濟(jì)復(fù)蘇階段。
其他Windows vm配置和存儲(chǔ)服務(wù)中斷發(fā)生時(shí)創(chuàng)建失敗的設(shè)置。此外,網(wǎng)絡(luò)編程錯(cuò)誤導(dǎo)致一小部分VMs被訪(fǎng)問(wèn)遠(yuǎn)程管理通過(guò)公共互聯(lián)網(wǎng)協(xié)議地址。
公司已經(jīng)部署補(bǔ)丁Azure防止虛擬機(jī)服務(wù)在未來(lái)以這種方式被打斷。
微軟還批評(píng)本身貧窮的通信中斷期間,說(shuō)有延遲顯示和錯(cuò)誤的信息在A(yíng)zure服務(wù)衛(wèi)生儀表板以及緩慢的反應(yīng)公司的官方支持。
的溝通渠道,如推@Azure賬戶(hù)和Azure博客也不足,在interruptoion留給客戶(hù)沒(méi)有足夠的信息,詹德寫(xiě)道。
公共云的核心是“你支付你得到什么!“挑戰(zhàn)與Azure(其他公共提供者)是沒(méi)有人可以說(shuō)話(huà)如果有P1(停機(jī))。所有的信息都是通過(guò)一個(gè)公共網(wǎng)站。甚至當(dāng)?shù)氐奈④浛蛻?hù)服務(wù)團(tuán)隊(duì)不能參與任何升級(jí)路徑。你需要確保100%工作量你放置在一個(gè)公共云提供商是正確的適合你的生意。是的我在一個(gè)私人工作/社區(qū)云提供商 |
|