對網絡中路由器,交換機,服務器,動力系統,空調系統,存儲設備,防火墻等設備進行 實時監測,自動生成網絡拓撲的嵌入式硬件設備。互聯網運維工作,以服務為中心,以穩定、安全、高效為三個基本點,確保公司的互聯網業務能夠 7×24 小時為用戶提供高質量的服務。運維人員對公司互聯網業務所依賴的基礎設施、基礎服務、線上業務進行穩定性加強,進行日常巡檢發現服務可能存在的隱患,對整體架構進行優化以屏蔽常見的運行故障,多數據中接入提高業務的容災能力。通過監控、日志分析等技術手段,及時發現和響應服務故障,減少服務中斷的時間,使公司的互聯網業務符合預期的可用性要求,持續穩定地為用戶提供務。在安全方面,運維人員需要關注業務運行所涉及的各個層面,確保用戶能夠安全、完整地訪問在線業務。在確保業務穩定、安全的前提下,還需保障業務高效的運轉,公司內快速的產出。運維工作需要對業務進行各方面優化。

基于ITIL的流程規范管理。服務SLA有保障,服務可視、可度量,保證服務的確定性、一致性、通過ITSS資質認證。
為用戶提供完善的運維文檔管理,資產配置管理,知識管理,以及支撐平臺/工具管理。
按照服務規劃、服務過渡、服務運營的階段,根據客戶需求制定服務目錄,確定服務范圍。梳理并制定服務流程,建立流程文檔。
在產品研發階段,參與產品設計評審,從運維的角度提出評審意見,使服務滿足運維準入的高可用要求。負責制定線上業務升級變更及回滾方案,并進行變更實施。掌握所負責的服務及服務間關聯關系、服務依賴的各種資源。能夠發現服務上的缺陷,及時通報并推進解決。制定服務穩定性指標及準入標準,同時不斷完善和優化程序和系統的功能、效率,提高運行質量。完善監控內容,提高報警準確度。在線上服務出現故障時,第一時間響應,對已知線上故障能按流程進行通報并按預案執行,未知故障組織相關人員聯合排障。對各服務的服務器資產進行管理,梳理服務器資源狀況、數據中心分布情況、網絡專線及帶寬情況,能夠合理使用服務器資源,根據不同服務的需求,分配不同配置的服務器,確保服務器資源的充分利用。制定服務例行排查點,并不斷完善。根據制定的服務排查點,對服務進行定期檢查。對排查過程中發現的問題,及時進行追查,排除可能存在的隱患。確定服務所需的各項監控、系統指標的閾值或臨界點,以及出現該情況后的處理預案。建立和更新服務預案文檔,并根據日常故障情況不斷補充完善,提高預案完備性。能夠制定和評審各類預案,周期性進行預案演練,確保預案的可執行性。制定數據備份策略,按規范進行數據備份工作。保證數據備份的可用性和完整性,定期開展數據恢復性測試。數據庫運維負責數據存儲方案設計、數據庫表設計、索引設計和SQL優化,對數據庫進行變更、監控、備份、高可用設計等工作。對數據庫單點風險和故障設計相應的切換方案,降低故障對數據庫服務的影響;不斷對數據庫整體性能進行優化,包括新存儲方案引進、硬件優化、文件系統優化、數據庫優化、SQL優化等,在保障成本不增加或者少量增加的情況下,數據庫可以支撐更多的業務請求。