導航:首頁 > IDC知識 > 伺服器可靠性

伺服器可靠性

發布時間:2020-11-05 09:06:40

1、如何增強伺服器內存的可靠性和可用性?

雖然處理器是任何伺服器的核心部件,但是工作負載的所有指令和數據都存儲在內存中。
在如今的虛擬化數據中心中,單單一台伺服器可能運行眾多虛擬機,而每個虛擬機作為一個文件駐留在內存中。但是當新的伺服器添置更多更快的內存以滿足更大的計算需求時,內存可靠性問題就顯得尤為重要。IT人員必須留意內存故障,並充分利用旨在增強內存可用性的伺服器特性。
如今,企業級伺服器採用數TB的64位內存,這些預制模塊遵守聯合電子設備工程委員會(JEDEC)DDR3和DDR3L(低電壓)標准而設計和製造。這樣一來,企業很容易從諸多內存廠商購得價位合理的內存,但是遵守標准並不能保證可靠性。
內存可靠性面臨的最大威脅並不是徹底的故障,不過可能會出現生產缺陷、電事件及其他物理異常引起的故障。確切地說,伺服器內存面臨的最大威脅來自隨機比特錯誤——某個比特出現自發逆轉。要是未加以檢查,僅僅一個比特出現錯誤就會以突如其來、可能災難性的方式,改動指令或改變數據流。
比特錯誤會自然發生。內存模塊的錯誤率從每兆位元組內存每小時大約1比特(有時被標為1010 errors/bit*h)到每兆位元組內存每百年1比特(1017 errors/bit*h)不等。這個范圍相差得太大了,但隨著內存子系統速度變快、電氣操作電壓變低以及伺服器上的內存總量增加,比特被「誤解」並影響工作負載的可能性隨之變得相當大。
其他因素也會加劇單比特錯誤,比如本底輻射(阿爾法粒子)、寄生電事件(如附近電磁干擾)、糟糕的主板屏蔽或設計,甚至DIMM插座上的電觸點受到破損或質量低劣。
增強內存可用性的特性
缺少可用內存始終是個問題,而奇偶校驗等錯誤檢測技術已存在了好多年。奇偶校驗很簡單,對於檢測單比特錯誤也很有效,但它糾正不了單比特錯誤,所以沒有大量地應用於伺服器。幸好,現在有或正出現另外許多特性,有助於增強內存可靠性。不妨考慮以下幾種方案:
ECC。系統廠商們不是依賴奇偶校驗,而是依賴糾錯碼(ECC)技術。ECC立足於奇偶校驗的基礎上,它使用一種演算法,為每64比特的內存創建和存儲一個8比特碼(每個地址總共72比特)。這種演算法和編碼讓系統得以實時檢測和糾正單比特錯誤,此外還能檢測多比特錯誤,並防止系統使用破損數據。ECC通常是許多通用伺服器上採用的確保內存可靠性的默認技術。
先進ECC。先進ECC把ECC方法擴大到了多種內存設備,讓ECC得以檢測和糾正多比特故障,只要這些故障出現在同一個內存設備裡面。不過,ECC和先進ECC並不支持任何一種故障切換機制,所以為了排除有問題的內存模塊,仍得關閉系統(或依賴其他系統技術)。許多企業級伺服器可以提供某種先進ECC,比如IBM ProLiant或戴爾PowerEdge。
內存錯誤跟蹤。應對內存錯誤的一方面是,首先密切跟蹤內存錯誤。新興的伺服器設計通過為錯誤率和位置做一份列表,開始密切跟蹤可以糾正的錯誤。一些伺服器還能將錯誤信息保存在內存模塊上的可重寫串列存在檢測(SPD)內存空間——可以讀取該內存空間,以便將來評估和分析。一旦系統能跟蹤可以糾正的內存錯誤,並將該信息轉移到系統的管理工具,就有可能通過記下錯誤率突然增加的DIMM來預測可能發生的內存故障。錯誤跟蹤稱得上是更先進的內存可靠性特性的先驅,更先進的特性包括DIMM故障切換或在物理內存空間裡面轉移數據。
熱備用內存。熱備用概念在磁碟存儲領域很常見,但只是最近才在伺服器設計流行起來。這是由於系統必須有一定的智能,才能先識別和跟蹤可以糾正的內存錯誤,之後才能決定把數據轉移到備用內存模塊上。內存錯誤跟蹤方面的技術進步讓伺服器的內存控制器得以將數據從存在的錯誤不可接受的DIMM轉移到同一通道中的另一個備用DIMM上。這也叫內存插槽備用(rank sparing)。這種方法存在的不足是,為錯誤發生前一直非生產性的伺服器增添內存需要一筆開支。
設備標記(Device tagging)。一種內存故障切換技術是基於BIOS的技術,名為設備標記。當系統跟蹤到出現錯誤率增加的內存模塊時,系統基本上就能把數據從有問題的內存轉移到ECC內存——實際上使用ECC內存作為一個小小的熱備用內存。這有望減少內存故障,但同時無法在這部分內存裡面進行錯誤檢測和糾正。設備標記被用作一種權宜之計,讓系統保持運行,直到有問題的內存模塊被換掉為止。
內存鏡像。完美的內存可靠性技術就是把伺服器上內存中內容從一個通道復制到另一個配對通道上。這實際上就是為內存建立了RAID 1機制。如果一個通道的內存裡面出現故障,內存控制器就會切換到配對通道上,沒有任何干擾;完成修復工作(如果需要修復)後,通道就可以重新進行同步。鏡像方法的缺點與存儲方面的RAID 1一樣;由於內存中的內容被復制,存儲容量減少了一半,或者說內存成本實際上翻了一番。
如今內存在現代虛擬化伺服器中扮演更關鍵的角色,所以應對和緩解內存錯誤的破壞性效應顯得比以往更為重要。

2、域名伺服器如何提高可靠性和保證數據的一致性?

域名伺服器如何提高可靠性和保證數據的一致性?
再看看別人怎麼說的。

3、請問:客戶端與伺服器端如何保證系統的可靠性。

從網路OSI模型的角度來看,ICA協議和RDP協議都是基於網路層和傳輸層之上,可以主要從三個方面來比較兩種產品的性能差異: 1、 協定基礎 RDP協定只能以TCP/IP協定基礎,ICA協議能夠適用於TCP/IP、IPX/SPX和NetBEUI等多種協議。其中,IPX/SPX協議被國內很多用戶所採用,廣泛應用於Novell網路。 MetaFrame可以應用於多種網路連接方式,如LAN、WAN、RAS dial-up、Direct serial connection(async.)、Direct dial-up和Browse available servers等。而Windows 2000 Server 只適用於上述連接方式中的前三種,即LAN、WAN和RAS dial-up。 主要的是Citrix在ICA協議的基礎上,提供了各種增值服務,負載平衡服務,資源管理服務,安裝管理服務及NFuse等。而RDP基礎上幾乎沒有任何服務。 2、 協議特徵 RDP支持本地列印和本地客戶列印假離線。ICA除支持這兩項功能以外,還具備以下不同的特徵: 色彩:ICA協議支持真彩(24位色),RDP協議只支持256色。 解析度:ICA協議支持無限大(64000X64000),RDP協議只支持800x600。 驅動映像:ICA協議可以將本地資源和伺服器資源無縫地集成在一起,給用戶的操作帶來極大的方便。RDP協議不具備此功能。 COM埠映射:ICA協議可以支持多種串口外設,RDP協議不具備此功能。 SpeedScreen2:該項專利技術大大減少了網路傳輸數據量,一般情況下,平均每個用戶的正常工作僅佔用10Kbps。最近,SpeedScreen3已正式推出,解決了通過廣域網系統發布應用程序普遍存在的延時問題。 協議穩定性:ICA協議的穩定性優於RDP協議。 多媒體支持:ICA協議能夠支持音頻、視頻和多媒體帶寬控制。而RDP不支持多媒體。 3、基於協議的應用: 在ICA協議之上,有一個豐富的應用層,能夠給用戶提供完善的Server-based Computing整體解決方案:無論是伺服器端還是客戶端,無論是用戶介面還是後台支持,無論是可靠性還是擴展性,無論是資源管理還是網路帶寬的高效利用,用戶都可根據需要選擇適當的MetaFrame及配套產品。可以從下面的分類比較中進行分析和對照: 客戶端操作系統廣泛性 幾乎現有的所有客戶端的操作系統,都適合安裝ICA客戶軟體,以訪問MetaFrame應用伺服器。其中包括: Windows NT Windows 95/98 Windows 3.11(Workgroups) Windows 3.1 Windows CE DOS Macintosh (Motorola, PowerPC) Browser—Internet Explorer Browser—Netscape UNIX- ALL major platform Java—JDK 1.1 Java—JDK 1.0 RISC OS PS OS NCI OS Net OS 而RDP協議只支持下面四種客戶端操作系統: Windows NT Windows 95/98 Windows 3.11(Workgroups) Windows CE 客戶端設備 同樣,通過Citrix的ICA協議,幾乎現有的所有形式的客戶端硬設備,都可以應用在Server-based Computing網路模式中,主要包括: PC機(DOS、Windows、UNIX、Linux等操作系統) Macintosh機(Motorola、PowerPC等) 手持計算機(HP Jornada、Compaq Cseries等) 網路計算機(Sun Java Station、IBM Network Station等) Windows終端(Win CE、DOS、Linux等操作系統) 網路終端(如Wyse Winterm 5000) 機頂盒設備(如BocaVision STB121) 而Windows 2000 Server中的終端服務功能只能在下列設備上得到實現: PC(Windows 3.11或以上版本) 手持計算機(HP Jornada、Compaq Cseries等) 基於Win CE的WBT 客戶端應用特徵 MetaFrame和Windows 2000 Server都具有點陣圖緩存、自動建置列印機、剪貼板復位向等功能,但MetaFrame更能提供如下卓越功能: Seamless Windows:用戶可把本地和遠程的應用程序無縫地集成在同一個窗口,使用戶使用應用程序時,感覺不到程序在本地還是伺服器上運行。 Business Recovery Client:保證客戶端業務的連續性,提高系統的容錯水平。 Program Neighborhood:該功能可以方便地將基於伺服器的應用程序的圖標,發布到用戶的客戶端,或直接放到用戶的32位Windows桌面上或「開始」菜單的程序集中。 伺服器應用特徵 在應用伺服器端,MetaFrame可以用戶提供系統管理的功能特徵: 一對一的Shadowing 一對多的Shadowing 多對一的Shadowing 跨伺服器的Shadowing 應用程序發布 Program Neighborhood 跨域管理 跨子網管理 客戶端自動升級 Shadow工具欄 發布應用程序到Web上 管理員工具欄 而Windows 2000 Server的終端服務僅僅提供一對一的Shadowing功能。 管理服務 在MetaFrame 產品之上,Citrix公司提供功能強大的服務軟體,主要包括: Load Balancing:動態路由用戶至「最休閑」的伺服器,以實現優化的負載平衡和集群管理,賦予系統強大的可靠性和可擴展性。沒有負載平衡功能構建的網路,只能是每台伺服器單獨運行,而且隨用戶的增加,系統不能擴展。W2K的Terminal Service沒有負載平衡技術。 Advanced Load Balancing:附加提供應用程序的發布與管理服務功能。 資源管理服務(RMS):系統管理員有效控制整個系統的資源配置和效率。 安裝管理服務(IMS):簡化對多個應用伺服器的系統及應用的安裝、設置和管理工作。 安全管理服務 加密技術 在此方面,Windows 2000 Server能夠提供資源管理服務、加密技術,而 Windows 2000 Server終端服務的NLB(Network Load Balancing)功能僅限於Windows 2000 Advanced Server版本,並且是一種「輪詢式」負載平衡,只能用於作Web Server,不能用於應用伺服器的集群工作模式。

4、騰訊雲伺服器的數據可靠性達到多少

騰訊雲分布式存儲和分發,數據跨多架構、多設備冗餘存儲,為對象提供 99.999999% 的可靠性。

5、伺服器的可靠性評價指標是什麼

CPU、內部存儲器和系統I/O依舊是伺服器的三大核心部件,衡量伺服器回的主要配置自然要從這答三大方面入手,三大核心部件能否得以和諧有效地工作,則顯現了伺服器提供商們的真功夫,因此,在IA伺服器時應主要從CPU、I/O系統、內存、伺服器管理系統、虛擬化功能、能源管理、可靠性幾個方面來考察。

6、在伺服器、軟體裡面,穩定性和可靠性有什麼區別?

伺服器與計算機的區別:
一、高擴展性
可擴展性是指伺服器的配置(內存、硬碟、處理器等)可以在原有基礎上很方便地根據需要增加。
為了實現擴展性,伺服器的機箱一般都比普通的機箱大一倍以上。設計大機箱的原因有兩個:一是機箱內部通風良好;二是機箱設有七八個硬碟托架,可以放置更多硬碟。
伺服器的電源輸出功率比普通PC大得多,甚至有冗餘電源(即兩個電源)。機箱電源的D型電源介面有十幾個之多,普通PC的機箱只有五六個。
伺服器的內存在可以根據需要擴展,一般可以擴展到幾GB
二、高可靠性
因為伺服器在網路中是連續不斷地工作的,因此,伺服器的可靠性要求是非常高的,目前,提高可靠性的普通做法是部件的冗條配置。伺服器可採用ECC 內存、RAID技術、熱插撥技術、冗餘電源、冗餘風扇等做法使伺服器具備(支持熱插撥功能)容錯能力和安全保護能力,從而提高可靠性
硬體的冗餘設備支持熱插撥功能,如冗餘電源風扇等,可以在單個部件夾效的情況下自動切換到備用的設備上,保證系統運行的連續性。RAID技術可保證硬碟在出現問題時在線切換,從而保證了數據的完整性。
三、高處理能力
伺服器可能需要同響應數十、數百、數千台客戶機的請求,因此,伺服器的速度應該比普通的PC快。
決定CPU性能的因素有很多,CPU只是其中一個因素,其它,如硬碟的速度、內存的大小、網卡的數據吞吐能力等,都是制約伺服器性能的重要因素。
四、高I/O性能
SCSI技術、RAID技術、高速智能網卡、較大的內存擴充能力都是提高IA架構伺服器的I/O能力的有效途徑。
五、高無故障運行時間
一般來說,工作伺服器的要求是工作時間內(每天8小時,每周5天)沒有故障;部門級伺服器的要求是每天24小時,每周5天內沒有故障;企業伺服器要求全年365天,每天24小時都沒有故障,伺服器隨時可用,簡稱為7x24。
六、高強管理性
IA架構伺服器主板上集成了各種感測器,用於檢測伺服器上的各種硬體設備。配合相應軟體,可以遠程監測伺服器。
七、運行伺服器操作系統
伺服器是硬體與軟體相結合的系統雖然在一台普通PC上安裝網路操作系統,也可以稱之為伺服器,但這台伺服器不具備真正伺服器的特性。
八、提供網路服務
已經具備了相應硬體平台和操作系統的伺服器還不能發揮它的作用。如果要發揮它的作用,必須在網路伺服器上安裝網路服務軟體。

參考資料:江西省計算機培訓學院《Windows 2003網路管理專業教程》

7、dns系統中,有哪些措施提高域名伺服器的可靠性

DNS軟體是黑客熱衷攻擊的目標,它可能帶來安全問題,在網路安全防護中,DNS的安全保護就顯得尤為重要。本文結合相關資料和自己多年來的經驗列舉了四個保護DNS伺服器有效的方法。以便讀者參考。
1.使用DNS轉發器
DNS轉發器是為其他DNS伺服器完成DNS查詢的DNS伺服器。使用DNS轉發器的主要目的是減輕DNS處理的壓力,把查詢請求從DNS伺服器轉給轉發器, 從DNS轉發器潛在地更大DNS高速緩存中受益。
使用DNS轉發器的另一個好處是它阻止了DNS伺服器轉發來自互聯網DNS伺服器的查詢請求。如果你的DNS伺服器保存了你內部的域DNS資源記錄的話, 這一點就非常重要。不讓內部DNS伺服器進行遞歸查詢並直接聯系DNS伺服器,而是讓它使用轉發器來處理未授權的請求。
2.使用只緩沖DNS伺服器
只緩沖DNS伺服器是針對為授權域名的。它被用做遞歸查詢或者使用轉發器。當只緩沖DNS伺服器收到一個反饋,它把結果保存在高速緩存中,然後把 結果發送給向它提出DNS查詢請求的系統。隨著時間推移,只緩沖DNS伺服器可以收集大量的DNS反饋,這能極大地縮短它提供DNS響應的時間。
把只緩沖DNS伺服器作為轉發器使用,在你的管理控制下,可以提高組織安全性。內部DNS伺服器可以把只緩沖DNS伺服器當作自己的轉發器,只緩沖 DNS伺服器代替你的內部DNS伺服器完成遞歸查詢。使用你自己的只緩沖DNS伺服器作為轉發器能夠提高安全性,因為你不需要依賴你的ISP的DNS服務 器作為轉發器,在你不能確認ISP的DNS伺服器安全性的情況下,更是如此。
3.使用DNS廣告者
DNS廣告者是一台負責解析域中查詢的DNS伺服器。例如,如果你的主機對於domain.com 和corp.com是公開可用的資源,你的公共DNS伺服器就應該為 domain.com 和corp.com配置DNS區文件。
除DNS區文件宿主的其他DNS伺服器之外的DNS廣告者設置,是DNS廣告者只回答其授權的域名的查詢。這種DNS伺服器不會對其他DNS伺服器進行遞歸查詢。這讓用戶不能使用你的公共DNS伺服器來解析其他域名。通過減少與運行一個公開DNS解析者相關的風險,包括緩存中毒,增加了安全。
4.使用DNS解析者
DNS解析者是一台可以完成遞歸查詢的DNS伺服器,它能夠解析為授權的域名。例如,你可能在內部網路上有一台DNS伺服器,授權內部網路域名 internalcorp.com的DNS伺服器。當網路中的客戶機使用這台DNS伺服器去解析techrepublic.com時,這台DNS伺服器通過向其他DNS伺服器查詢來執行遞歸 以獲得答案。
DNS伺服器和DNS解析者之間的區別是DNS解析者是僅僅針對解析互聯網主機名。DNS解析者可以是未授權DNS域名的只緩存DNS伺服器。你可以讓DNS 解析者僅對內部用戶使用,你也可以讓它僅為外部用戶服務,這樣你就不用在沒有辦法控制的外部設立DNS伺服器了,從而提高了安全性。當然,你也可以讓DNS解析者同時被內、外部用戶使用。

8、IIS 6.0的Web伺服器更高的可靠性和可用性

IIS 6.0已經經過了廣泛的重新設計,以提高Web伺服器的可靠性和可用性。新的容錯進程架構和其它功能特性可以幫助用戶減少不必要的停機時間,並提高應用程序的可用性。
功能特性 描述
容錯進程架構 IIS 6.0的容錯式進程架構將Web站點和應用程序隔離到一個自包含的單元之中(又稱應用程序池)。應用程序池為管理員管理一組Web站點和應用程序提供了便利,同時提高了系統的可靠性,因為一個應用程序池中的錯誤不會引起另外一個應用程序池或者伺服器本身發生故障。
健康狀況監視 IIS 6.0定期檢查應用程序池的狀態,並自動重新啟動應用程序池中發生故障的Web站點或應用程序,從而提高了應用程序的可用性。通過自動禁用在短時間內頻繁發生故障的Web站點和應用程序,IIS 6.0可以保護伺服器和其它應用程序的安全。
自動進程回收IIS 6.0可以根據一組靈活的標准和條件——例如CPU利用率和內存佔用情況,自動停止和重新啟動發生故障的Web站點和應用程序,同時將請求放入隊列。IIS 6.0還可以在回收一個工作進程時對客戶機的TCP/IP連接加以維護,將Web服務客戶端應用程序與後端不穩定的Web應用程序隔離開來。
快速的故障保護 如果某個應用程序在短時間內頻繁發生故障,IIS 6.0將自動禁用該程序,並且向所有新發出和排入隊列的針對該應用程序的請求返回一個「503服務不可用」錯誤信息。例如,此外,還可以觸發某些定製操作,例如觸發一個調試操作或者向管理員發出通知。快速故障保護可以保護Web伺服器免遭拒絕服務攻擊。

與伺服器可靠性相關的知識