機器學習有望為先進的管理開創(chuàng)新的紀元,但數(shù)據(jù)中心的許多基礎(chǔ)設(shè)施的管理仍然還有很長的路要走,這些基礎(chǔ)設(shè)施管理有必要從過去那種晦澀難懂基于電子表格管理管理逐漸發(fā)展演化到以自動化管理為主的方向上來。
數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)軟件的終極目標是最終實現(xiàn)自我管理或完全自動化的數(shù)據(jù)中心。
業(yè)界當前寄希望于人工智能驅(qū)動的管理軟件(可能是基于的)將會監(jiān)控和控制IT和設(shè)施基礎(chǔ)設(shè)施,以及應(yīng)用程序。人工智能將實現(xiàn)無縫整體性地 可能是跨越多個站點 實施其監(jiān)控管理。冷卻散熱、電源、計算、工作負載、存儲和網(wǎng)絡(luò)將動態(tài)化,以實現(xiàn)最高效率,生產(chǎn)力和可用性。
通過將基于云的分析應(yīng)用于從數(shù)千個地點采集的傳感器數(shù)據(jù),設(shè)施設(shè)備和IT也將在一定程度上得到自我修復(fù),從而有助于企業(yè)數(shù)據(jù)中心得以運用其來指導(dǎo)和制定有針對性的預(yù)測性和預(yù)防性維護計劃。備用零件將可能是經(jīng)由靈巧的機器人進行訂購、測試和安裝,以便在需要時精確匹配,以避免發(fā)生故障失效,同時避免不必要的維護和測試。
這種以人工智能驅(qū)動的管理模式在數(shù)據(jù)中心業(yè)界可能已經(jīng)有十年甚至更長的歷史了,但是,整個數(shù)據(jù)中心行業(yè)目前也僅僅只是在部分的領(lǐng)域取得了一些進展。例如,谷歌公司在2014年透露,該公司一直在使用通過其收購英國AI專家DeepMind公司所獲得的技術(shù)來改善其部分數(shù)據(jù)中心站點的基礎(chǔ)設(shè)施管理。
正如谷歌在當時所指出的那樣:鑒于數(shù)據(jù)中心內(nèi)部有太多的電力和冷卻設(shè)備相互作用,故而使得其基礎(chǔ)設(shè)施的管理無疑是太過復(fù)雜而人類員工是無法勝任的。該公司當時曾表示:
想象一處簡化的數(shù)據(jù)中心場景:一處數(shù)據(jù)中心只有10款設(shè)備,其中每款設(shè)備有10個設(shè)置,可能將會有10到100億款可能的電源配置,以及相關(guān)可能的其它配置,這就已經(jīng)遠遠超出任何人工測試的真實能力的范疇了 但即使這樣,其也遠遠低于一處實際的數(shù)據(jù)中心可能的配置。
AI驅(qū)動的效率
谷歌公司使用來自其數(shù)據(jù)中心內(nèi)部的成千上萬個傳感器所收集的歷史數(shù)據(jù)信息來訓練一款 深度人工神經(jīng)網(wǎng)絡(luò)集合體 。谷歌表示,將所得到的算法應(yīng)用于其基礎(chǔ)設(shè)施的管理過程,使得其實現(xiàn)了冷卻能耗降低了40%,進而使得數(shù)據(jù)中心的整體能源消耗降低了15%.目前,該公司還在繼續(xù)開發(fā)和完善機器學習的使用 人工智能應(yīng)用的一個子集范疇 無疑還將進一步取得更杰出的成果。
但事實上,并非僅僅只有谷歌這樣的高級云服務(wù)供應(yīng)商們在進行著機器學習領(lǐng)域的試驗項目。DCIM軟件供應(yīng)商Vigilent公司表示,該公司已經(jīng)將機器學習整合融入其動態(tài)的冷卻管理系統(tǒng)多年了:每一分鐘,來自數(shù)百或數(shù)千個環(huán)境傳感器的數(shù)據(jù)均經(jīng)由無線網(wǎng)狀網(wǎng)絡(luò)被收集,并進入中央人工智能(AI)引擎 借助復(fù)雜的動態(tài)控制算法,然后將指令實時發(fā)送到數(shù)據(jù)中心站點的冷卻系統(tǒng),制定旨在優(yōu)化性能績效的決策。
在不久的將來,我們可以期待更多的DCIM供應(yīng)商、托管服務(wù)和云服務(wù)提供商擁有自主研發(fā)的工具,進而將機器學習和其他形式的AI人工智能整合到管理系統(tǒng)中。從孤立的企業(yè)本地部署DCIM軟件轉(zhuǎn)移到基于云的數(shù)據(jù)中心管理即服務(wù)(DMaaS)工具(來自多個站點的數(shù)據(jù)將匯總在云中)也應(yīng)該有助于加速這一過程。
從電子表格到AI的漫長過程
但是,盡管人們會很容易陷入又人工智能所帶來的令人興奮且具有顛覆破壞性的潛力,但數(shù)據(jù)中心業(yè)界當前最為重要的則是亟待反思大多數(shù)數(shù)據(jù)中心將如何繼續(xù)設(shè)計、構(gòu)建和運行的這一嚴峻的現(xiàn)實問題。
事實上,數(shù)據(jù)中心的許多管理過程 特別是在基礎(chǔ)設(shè)施管理方面 仍然嚴重的依賴于傳統(tǒng)的設(shè)備和人工手動操作。例如,正如我們以前所強調(diào)的那樣,盡管DCIM工具已經(jīng)存在了將近十年了,但大量的數(shù)據(jù)中心運營商們?nèi)匀粚υ摷夹g(shù)持懷疑的態(tài)度。多達50%的數(shù)據(jù)中心站點(可能是那些較小型的終端站點)仍然依靠可信但不太智能的建筑管理工具以及電子表格,書面文檔和其他手動流程來運行其基礎(chǔ)設(shè)施。
打造數(shù)字化
盡管整個數(shù)據(jù)中心業(yè)界已經(jīng)看到了相關(guān)軟件工具 包括一些DCIM軟件以及專業(yè)計算機維護管理系統(tǒng)(CMMS) 獲得了長足的發(fā)展,可以用以幫助管理和自動化數(shù)據(jù)中心的重要管理程序的應(yīng)用程序。但事實上,所謂的操作和維護(或者說O M),其實踐方案在紙質(zhì)文檔中或者說在設(shè)備工作人員的負責人看來,仍然是常規(guī)性的。
在數(shù)據(jù)中心運營商們開始充分利用先進的支持AI的管理工具的潛在優(yōu)勢之前,他們還將需要解決更為智能化的操作方面的問題。這些包括:部署企業(yè)本地或基于云的DCIM工具,用于資產(chǎn)管理和環(huán)境監(jiān)控。這個監(jiān)控和管理層將需要及時的到位,然后才能執(zhí)行一些更復(fù)雜的AI操作。
安裝更多的傳感器和儀表。包括聲學和振動裝置 以便能夠密切監(jiān)測數(shù)據(jù)中心的溫度、濕度、電能質(zhì)量和其他指標。機器學習工具將需要越來越多的數(shù)據(jù)。
更好地協(xié)調(diào)IT和設(shè)施團隊(由DCIM軟件支持),以便更全面地管理數(shù)據(jù)中心基礎(chǔ)設(shè)施。
盡可能數(shù)字化和自動化許多以前由人工手動操作的流程和程序。
數(shù)據(jù)中心工作人員們經(jīng)歷了什么?
關(guān)于廣泛采用基于人工智能的數(shù)據(jù)中心管理的探討中,另外一個顯而易見的話題是:其將對于數(shù)據(jù)中心現(xiàn)有的設(shè)施和IT人員帶來怎樣的影響?正如我們曾強調(diào)過的那樣,數(shù)據(jù)中心業(yè)界將朝著遠程無人值守管理( Lights-out )的趨向發(fā)展,由此,IT和一些設(shè)施基礎(chǔ)設(shè)施的管理會是自動化的,并且是遠程執(zhí)行的。隨著AI工具進一步變得更加發(fā)達,這個過程可能會進一步加劇,并擴散到更多類型的站點。
任何一處數(shù)據(jù)中心設(shè)施的現(xiàn)場工作人員的數(shù)量都將不可避免地繼續(xù)減少。但并不是總體上造成大面積的員工失業(yè),更多的操作運營人員可能會為服務(wù)型公司工作,如從事設(shè)施管理服務(wù),支持多家運營商和數(shù)據(jù)中心站點。
機器是否會崛起?
對于關(guān)于人工智能的潛在好處,幾乎每一個與此相關(guān)的故事都有涉及。也存在著某些警告 其通常是通過科幻書籍和電影 機器橫行,甚至威脅我們?nèi)祟惖纳?。對于?shù)據(jù)中心這個世界來說,這可能有點牽強附會,但是谷歌公司發(fā)現(xiàn),AI系統(tǒng)所提供的答案和行動措施可能并不總是能夠完美的符合最初的預(yù)期。
谷歌的算法就提高數(shù)據(jù)中心站點效率達成了一個非常簡單和準確的結(jié)論:
關(guān)于實現(xiàn)最大的節(jié)能,該模式的第一個建議是:關(guān)閉整個數(shù)據(jù)中心設(shè)施。嚴格來說,這并不是不準確的,但其實也不是特別有用。
因此,考慮到潛在的意外后果,為人工智能驅(qū)動的管理做好準備可能會是一個緩慢而謹慎的過程,需要大量的基礎(chǔ)性工作,可能并不是一件壞事。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類線,屏蔽模塊,配線架及相關(guān)模塊配件的研發(fā)和生產(chǎn)。
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號