多場景落地智維運(yùn)維 新技術(shù)護(hù)航系統(tǒng)效率

來源:大京網(wǎng)

國內(nèi)某知名物流企業(yè)研發(fā)了先進(jìn)的快件運(yùn)營信息管理系統(tǒng),并在全網(wǎng)絡(luò)快遞員中統(tǒng)一投入使用手持終端設(shè)備,實(shí)現(xiàn)了快件操作與信息采集的同步和快件運(yùn)營信息的實(shí)時(shí)傳遞。運(yùn)營信息系統(tǒng)的運(yùn)行依賴網(wǎng)絡(luò),因此,網(wǎng)絡(luò)的穩(wěn)定和可靠成為了支持該企業(yè)業(yè)務(wù)生命線的關(guān)鍵問題。面對(duì)越來越復(fù)雜的網(wǎng)絡(luò)構(gòu)架和爆發(fā)式增長的應(yīng)用上線,運(yùn)維團(tuán)隊(duì)常常需要解決業(yè)務(wù)系統(tǒng)突然中斷、能下降、用戶訪問異常等等問題,因此需要建設(shè)一套新的網(wǎng)絡(luò)能監(jiān)測系統(tǒng),與現(xiàn)有的基礎(chǔ)監(jiān)控系統(tǒng)共同支撐,實(shí)時(shí)展示和分析應(yīng)用的能以及用戶體驗(yàn)等情況。

2020年,該企業(yè)上線了智維數(shù)據(jù)nCompass網(wǎng)絡(luò)流量監(jiān)控臺(tái),實(shí)現(xiàn)了多源數(shù)據(jù)采集以及業(yè)務(wù)能和網(wǎng)絡(luò)能可視化監(jiān)控,為業(yè)務(wù)系統(tǒng)與應(yīng)用能故障分析提供了可靠的數(shù)據(jù)支撐。本次案例分享將聚焦該物流企業(yè)通過網(wǎng)絡(luò)流量智能分析系統(tǒng),提升系統(tǒng)故障處置效率,支撐系統(tǒng)穩(wěn)定快速運(yùn)轉(zhuǎn)的背后故事。

“快”的保障

是強(qiáng)大穩(wěn)定的自動(dòng)化、數(shù)字化全流程

物流業(yè)的數(shù)據(jù)化運(yùn)營是關(guān)聯(lián)到派單、收件、派件等一系列的復(fù)雜流程。舉個(gè)例子,消費(fèi)者在網(wǎng)上下單后,購物臺(tái)會(huì)推送給物流企業(yè),此時(shí)快遞員就會(huì)收到收件工單。收件完成后,這個(gè)快遞會(huì)被送到相應(yīng)的營業(yè)網(wǎng)點(diǎn),由營業(yè)網(wǎng)點(diǎn)進(jìn)行分撥,分揀,訂單處理到收件網(wǎng)點(diǎn),最后送到消費(fèi)者手里?,F(xiàn)在,國內(nèi)大的物流公司基本上整個(gè)過程都是全自動(dòng)的,這樣能保障快遞的送達(dá)效率是很高的。

因?yàn)閷?duì)效率要求很高,所以對(duì)于網(wǎng)絡(luò)效率和穩(wěn)定要求也特別高,物流的核心是效率,而物流的每個(gè)流程都是通過云端,網(wǎng)絡(luò)數(shù)字化去流轉(zhuǎn)的,要達(dá)到最優(yōu)轉(zhuǎn)化,網(wǎng)絡(luò)的穩(wěn)定和效率是重點(diǎn)。

自動(dòng)告警,智能分析

實(shí)現(xiàn)穩(wěn)定、連續(xù)的網(wǎng)絡(luò)支撐

那么如何保障物流網(wǎng)絡(luò)的穩(wěn)定,又有哪些難點(diǎn)問題呢?以前有網(wǎng)絡(luò)故障發(fā)生,比如當(dāng)應(yīng)用能下降,運(yùn)維部門只能通過人工經(jīng)驗(yàn)逐個(gè)排查,如果不能及時(shí)解決就會(huì)影響到前端的業(yè)務(wù)流轉(zhuǎn)。另外還有一些合規(guī)和管理風(fēng)險(xiǎn)的問題,比如符合等保2.0的要求,國家監(jiān)管部門的要求,以及出于數(shù)據(jù)安全防護(hù)的要求,需要做到運(yùn)營的精細(xì)化管理。

而現(xiàn)在該物流企業(yè)采用的是智維數(shù)據(jù)的nCompass網(wǎng)絡(luò)流量監(jiān)控臺(tái),網(wǎng)絡(luò)上有故障發(fā)生,可以通過nCompass溯源找到問題根源,有隱患發(fā)生也有自動(dòng)告警,網(wǎng)絡(luò)部門可以先把這個(gè)故障梳理掉,讓業(yè)務(wù)恢復(fù)。應(yīng)用層有問題也能發(fā)出告警,應(yīng)用組可以通過排他的方式把問題迅速解決。

以前看不到應(yīng)用之間訪問鏈的情況,現(xiàn)在網(wǎng)絡(luò)部門可以通過nCompass對(duì)接負(fù)載均衡的API接口,這樣能看到整體網(wǎng)絡(luò)每個(gè)節(jié)點(diǎn)發(fā)生的問題,加上該企業(yè)基礎(chǔ)監(jiān)控對(duì)物理設(shè)備的監(jiān)控能力,這樣結(jié)合就能實(shí)現(xiàn)整體的運(yùn)維監(jiān)控能力。

多場景落地智維運(yùn)維,新技術(shù)護(hù)航系統(tǒng)效率

以下是幾個(gè)nCompass流量監(jiān)控臺(tái)幫助解決運(yùn)維故障提升IT效率的例子。

場景1

訪問流程突發(fā)故障

web頁面無法訪問是該物流企業(yè)用戶經(jīng)常會(huì)遇到的問題,有一種常見現(xiàn)象是證書切換問題,應(yīng)用要實(shí)現(xiàn)滑的切換。當(dāng)遇到用戶反饋頁面打不開,網(wǎng)絡(luò)部門可以通過nCompass來分析一下這個(gè)應(yīng)用到底有沒有成功跳轉(zhuǎn),還是錯(cuò)誤跳轉(zhuǎn)到別的地方去了。

還有一些頁面打不開是由于調(diào)用第三方接口失敗造成的。不通有很多種,一種是對(duì)方加了白名單,但是這邊的防火墻沒有放行。那么這個(gè)請(qǐng)求有沒有通過,網(wǎng)絡(luò)部門同樣也可以通過nCompass去監(jiān)控它。

還有會(huì)出現(xiàn)運(yùn)營商骨干網(wǎng)振蕩,導(dǎo)致頁面打不開。此時(shí)通過nCompass去溯源,發(fā)現(xiàn)只有某個(gè)城市DNS有問題,網(wǎng)絡(luò)部門就可以反饋給下面的快遞員或者反饋給第三方,是哪個(gè)地方現(xiàn)在不好,可以及時(shí)切換一下線路。

再比如有用戶反饋網(wǎng)站打不開,應(yīng)用組懷疑是DNS解析失敗,這時(shí)候通過nCompass去檢查,發(fā)現(xiàn)DNS解析率是99%,說明DNS解析正常,那么網(wǎng)絡(luò)部門就可以反饋給應(yīng)用組,請(qǐng)他們?nèi)ヅ挪槠渌麊栴}。

場景2

鏈路優(yōu)化管理與重大事件全局監(jiān)控

鏈路管理是各個(gè)物流企業(yè)運(yùn)維部門都特別重視的,鏈路管理指的是運(yùn)營商帶寬的問題,要保障網(wǎng)絡(luò)暢通的穩(wěn)定,網(wǎng)絡(luò)部門可以用nCompass看一下抖動(dòng)、延遲有沒有問題,如果此時(shí)監(jiān)控主動(dòng)告警提示某個(gè)骨干有問題,運(yùn)維人員可以將出口的負(fù)載均衡切換到另外的鏈路上,就能夠保證外部訪問正常。

nCompass提供了企業(yè)全局的可視化監(jiān)控能力,可以把負(fù)載均衡、鏈路管理、業(yè)務(wù)監(jiān)控都統(tǒng)一到一個(gè)臺(tái)上來。比如物流行業(yè)在雙十一、雙十二這種業(yè)務(wù)量高峰期,就可以利用nCompass看到實(shí)時(shí)進(jìn)來的流量帶寬,包括應(yīng)用之間互訪的延遲,這樣在大型促銷或業(yè)務(wù)流量特別大的時(shí)候會(huì)有一個(gè)基礎(chǔ)保障。

通過nCompass主動(dòng)告警,網(wǎng)絡(luò)人員可以實(shí)時(shí)監(jiān)測流量是否穩(wěn)定,延遲的指標(biāo)高低,應(yīng)用負(fù)載率等等,有問題可以提前處理掉。因?yàn)閺臉I(yè)務(wù)開始報(bào)障到故障發(fā)生會(huì)間隔一些時(shí)間,這個(gè)時(shí)間里使用流量臺(tái)可以幫運(yùn)維人員做到先知先覺,避免該物流企業(yè)出現(xiàn)大范圍的故障,保障前臺(tái)業(yè)務(wù)運(yùn)轉(zhuǎn)和整體網(wǎng)絡(luò)運(yùn)維的效率。

場景3

符合等保2.0合規(guī)要求

根據(jù)三級(jí)等保要求,物流企業(yè)的系統(tǒng)日志需要存半年。但是物流行業(yè)通常的訪問量太大,所以該企業(yè)也通過與nCompasss合作,定制化表單,達(dá)到了等保的要求。而在數(shù)據(jù)安全方面,網(wǎng)絡(luò)部門也可以利用nCompasss將應(yīng)用日志與網(wǎng)絡(luò)日志結(jié)合,來溯源異常的IP地址。

展望

進(jìn)一步的數(shù)據(jù)整合,搭建完整的運(yùn)營數(shù)據(jù)監(jiān)控,

是未來實(shí)現(xiàn)AIOps,提升全流程效率的最佳方案!

物流企業(yè)作為網(wǎng)絡(luò)型組織,面對(duì)成千上萬的物流網(wǎng)點(diǎn),面對(duì)管控難度越來越大的情況,需要以AIOps等新技術(shù)為抓手,來幫助實(shí)現(xiàn)對(duì)越來越多網(wǎng)點(diǎn)的可視化管控。在信息系統(tǒng)中能夠第一時(shí)間看到所有的數(shù)據(jù),實(shí)時(shí)處理,才能實(shí)現(xiàn)實(shí)時(shí)決策、實(shí)時(shí)優(yōu)化,幫助管控和衡整個(gè)網(wǎng)絡(luò)。

目前該企業(yè)已經(jīng)通過nCompass實(shí)現(xiàn)了在網(wǎng)絡(luò)層的監(jiān)控,未來希望將所有的網(wǎng)絡(luò)層數(shù)據(jù)、應(yīng)用層數(shù)據(jù),包括虛擬機(jī)互訪、K8S集群互訪全部數(shù)據(jù)都整合到nCompass臺(tái)上來,通過nCompass來排查故障,這樣解決問題的方式會(huì)變得更加簡單,人效會(huì)更高?,F(xiàn)在智維數(shù)據(jù)也在打造“場景化”的解決方案,那么在之后的合作中,雙方能將技術(shù)與場景結(jié)合得更緊密,進(jìn)一步提升IT運(yùn)營效率。

標(biāo)簽: 物流行業(yè) 智維數(shù)據(jù) 基礎(chǔ)監(jiān)控 運(yùn)維團(tuán)隊(duì)

推薦

財(cái)富更多》

動(dòng)態(tài)更多》

熱點(diǎn)