Azure Stack Hub 包含基礎(chǔ)結(jié)構(gòu)監(jiān)視功能,有助于查看 Azure Stack Hub 區(qū)域的運行狀況和警報。 “區(qū)域管理”磁貼列出了 Azure Stack Hub 的所有已部署區(qū)域。 它默認固定在默認提供商訂閱的管理員門戶上。 該磁貼除了顯示每個區(qū)域的活動嚴重警報和警告警報數(shù)目以外, 也是 Azure Stack Hub 運行狀況和警報功能的入口點。
運行狀況資源提供程序管理運行狀況和警報。 在 Azure Stack Hub 部署和配置期間,Azure Stack Hub 基礎(chǔ)結(jié)構(gòu)組件將注冊到運行狀況資源提供程序。 注冊后,可以顯示每個組件的運行狀況和警報。 Azure Stack Hub 中的“運行狀況”是個簡單的概念。 如果組件的已注冊實例存在警報,該組件的運行狀況會反映最不利的活動警報的嚴重性:警告或嚴重。
Azure Stack Hub 引發(fā)的警報只有兩個嚴重級別:警告 和 嚴重。
警告
操作員可以按計劃方式處理警告警報。 該警報通常不會影響用戶工作負荷。
嚴重
操作員應(yīng)緊急處理嚴重警報。 這些警報指示目前影響或?qū)⒑芸煊绊?Azure Stack Hub 用戶的問題。
可以通過管理員門戶以及 REST API 和 PowerShell 查看組件的運行狀況。
若要在門戶中查看運行狀況,請在“區(qū)域管理”磁貼中單擊想要查看的區(qū)域。 可以查看基礎(chǔ)結(jié)構(gòu)角色和資源提供程序的運行狀況。
可以單擊資源提供程序或基礎(chǔ)結(jié)構(gòu)角色來查看更詳細的信息。
警告
如果單擊基礎(chǔ)結(jié)構(gòu)角色,然后單擊角色實例,則會看到“啟動”、“重啟”或“關(guān)機”選項。 對集成系統(tǒng)應(yīng)用更新時,請勿使用這些操作。 此外,請勿 在 Azure Stack 開發(fā)工具包 (ASDK) 環(huán)境中使用這些選項。 這些選項是針對每個基礎(chǔ)結(jié)構(gòu)角色具有多個角色實例的集成系統(tǒng)環(huán)境設(shè)計的。 在 ASDK 中重啟角色實例(特別是 AzS-Xrp01)會導(dǎo)致系統(tǒng)不穩(wěn)定。 如需故障排除方面的幫助,請在 Azure Stack Hub 論壇中提問。
可直接從“區(qū)域管理”邊欄選項卡查看每個 Azure Stack Hub 區(qū)域的活動警報列表。 默認配置中的第一個磁貼是“警報”磁貼,其中顯示區(qū)域的嚴重警報和警告警報摘要。 如同此邊欄選項卡中的其他磁貼一樣,可將“警報”磁貼固定到儀表板,以便快速訪問。
若要查看區(qū)域的所有活動警報的列表,請選擇“警報”磁貼的頂部。 若要查看警報的篩選列表(“嚴重”或“警告”),請選擇磁貼中的“嚴重”或“警告”行項。
“警報”邊欄選項卡支持按狀態(tài)(“活動”或“已關(guān)閉”)和嚴重性(“嚴重”或“警告”)進行篩選。 默認視圖顯示所有活動警報。 所有已關(guān)閉的警報在七天后將從系統(tǒng)中刪除。
備注
如果某個警報保持活動狀態(tài),但超過一天仍未更新,可運行 Test-AzureStack,如果未報告問題,則可關(guān)閉該警報。
“視圖 API”操作顯示用于生成列表視圖的 REST API。 借助此操作可以快速熟悉可用于查詢警報的 REST API 語法。 可在自動化中使用此 API,或者將它與現(xiàn)有的數(shù)據(jù)中心監(jiān)視、報告和票證解決方案相集成。
可以單擊特定的警報來查看警報詳細信息。 警報詳細信息顯示與警報關(guān)聯(lián)的所有字段,并可讓用戶快速導(dǎo)航到受影響的組件和警報源。 例如,如果某個基礎(chǔ)結(jié)構(gòu)角色實例脫機或不可訪問,則會發(fā)生以下警報。
某些警報支持 修復(fù) 選項,如上圖所示。 選中以后,“修復(fù)”操作會執(zhí)行特定于警報的步驟來嘗試解決問題。 選中以后,“修復(fù)”操作的狀態(tài)會以門戶通知的形式提供。
“修復(fù)”操作會在同一門戶通知邊欄選項卡中報告成功完成了操作或無法完成操作。 如果某項“修復(fù)”操作因出現(xiàn)警報而失敗,則可在警報詳細信息中重新運行“修復(fù)”操作。 如果“修復(fù)”操作成功完成,請勿 重新運行“修復(fù)”操作。 基礎(chǔ)結(jié)構(gòu)角色實例重新聯(lián)機后,會自動關(guān)閉此警報。
如果不支持 " 修復(fù) " 選項,請確保遵循警報中提供的一組完整的修正說明。 例如,內(nèi)部證書過期修正步驟將指導(dǎo)你完成秘密旋轉(zhuǎn)過程:
當問題解決時,許多(但不是每個警報)將自動關(guān)閉。 如果 Azure Stack 集線器解決該問題,則 "提供修復(fù)操作" 按鈕的警報將自動關(guān)閉。 對于所有其他警報,請在執(zhí)行補救步驟之后選擇“關(guān)閉警報”。 如果問題仍然存在,Azure Stack 集線器會生成新的警報。 如果解決了問題,警報將保持關(guān)閉,無需采取其他步驟。