导航:首页 > IDC知识 > 容错服务器

容错服务器

发布时间:2020-09-27 21:20:53

1、什么叫冗余服务器

冗余服务器是指重复配置系统的一些部件。

当系统发生故障时,冗余配置的部件介入并承担故障部件的当系统发生故障时,比如某一设备发生损坏,冗余配置的部件可以作为备援,及时介入并承担故障部件的工作,由此减少系统的故障时间。

冗余尤用于应急处理。冗余可以存在于不同层面,如网络冗余、服务器冗余、磁盘冗余、数据冗余等。

(1)容错服务器扩展资料

在服务器里,冗余系统配件主要有:  

1、电源:高端服务器产品中普遍采用双电源系统,这两个电源是负载均衡的,即在系统工作时它们都为系统提供电力,当一个电源出现故障时,另一个电源就承担所有的负载。

2、RAID:廉价冗余磁盘阵列,顾名思义,它由几个磁盘组成,通过一个控制器协调运动机制使单个数据流依次写入这几个磁盘中。

3、 I/O卡:对服务器来说,主要指网卡和硬盘控制卡的冗余。网卡冗余是在服务器中插上双网卡。冗余网卡技术原为大型机及中型机上的技术,现在也逐渐被PC服务器所拥有。

4、CPU:系统中主处理器并不会经常出现故障,但对称多处理器(SMP)能让多个CPU分担工作以提供某种程度的容错。

5、风扇冗余:风扇冗余是指再服务器的关键发热部件上配置的降温风扇有主用和备用两套,这两套风扇具有自动切换功能。

2、美国stratus容错服务器

容错服务器一般用在高等级的视频存储系统里面,我们原来初步设计是有用的,不过在施工图设计的使用采用了另外的技术。目前来说,在广东的高速公路行业中还是比较少见的。

3、什么是容错方法

容错FT(Fault Tolerant)技术一般利用冗余硬件交叉检测操作结果。随着处理器速度的加快和价格的下跌而越来越多地转移到软件中。未来容错技术将完全在软件环境下完成,那时它和高可用性技术之间的差别也就随之消失了。 局域网的核心设备是服务器。用户不断从文件服务器中大量存取数据,文件服务器集中管理系统共享资源。但是如果文件服务器或文件服务器的硬盘出现故障,数据就会丢失,所以,我们在这里讲解的容错技术是针对服务器、服务器硬盘和供电系统的。
1、双重文件分配表和目录表技术
硬盘上的文件分配表和目录表存放着文件在硬盘上的位置和文件大小等信息,如果它们出现故障,数据就会丢失或误存到其他文件中。通过提供两份同样的文件分配表和目录表,把它们存放在不同的位置,一旦某份出现故障,系统将做出提示,从而达到容错的目的。
2、快速磁盘检修技术
这种方法是在把数据写入硬盘后,马上从硬盘中把刚写入的数据读出来与内存中的原始数据进行比较。如果出现错误,则利用在硬盘内开设的一个被称为“热定位重定区”的区,将硬盘坏区记录下来,并将已确定的在坏区中的数据用原始数据写入热定位重定区上。
3、磁盘镜像技术
磁盘镜像是在同一存储通道上装有成对的两个磁盘驱动器,分别驱动原盘和副盘,两个盘串行交替工作,当原盘发生故障时,副盘仍旧正常工作,从而保证了数据的正确性。
4、双工磁盘技术
它是在网络系统上建立起两套同样的且同步工作的文件服务器,如果其中一个出现故障,另一个将立即自动投入系统,接替发生故障的文件服务器的全部工作。
5、网络操作系统具有完备的事务跟踪系统
这是针对数据库和多用户软件的需要而设计的,用以保证数据库和多用户应用软件在全部处理工作还没有结束时或工作站或服务器发生突然损坏的情况下,能够保持数据的一致。其工作方式是:对指定的事务(操作)要么一次完成,要么什么操作也不进行。
6、UPS监控系统
UPS监控系统用于监控网络设备的供电系统,以防止供电系统电压波动或中断。 在工作中,我们选取的容错技术应根据实际情况而定(如资金,规模等)

4、什么是服务器的容错技术?

容错技术是一个大的概念,广义上说,就是系统对错误的容忍能力。以服务器为例,当服务器出现故障的时候,如何确保系统不中断。需要注意的是,导致系统中断的因素有很多,不仅仅是服务器的故障,软件错误,或者外界突发因素都可以导致系统故障。系统故障有两种情况,一个是系统瘫痪了,业务中断。这种故障容易察觉,此外,还有另外一种故障,就是受外界影响,服务器的计算结果产生错误,这种情况下,系统不会瘫痪,但会产生错误的计算结果,这种故障不容易察觉,但危害也更加巨大。即所谓可信计算的问题。
解决系统容错的问题,有两种主要的技术,一种容错服务器,另外一种是集群(或者双机)。都是为了避免服务器硬件故障对系统产生的影响。前者较之后者有更高的可靠性,或者更加经济。除了硬件错误之外,软件问题、病毒等问题,只有通过升级、打补丁来解决。

5、美国容错服务器Stratus ftserver 2600 国内的售价是多少?

我公司收到的报价是293000元

6、怎么对域控制器和文件服务器采取容错

ERP系统由于涉及到供应链管理,访问ERP系统的用户会比较多,在一个大型的ERP系统中,同一时间访问ERP系统核心数据库的用户可能达到几百上千个,而中小企业一般只有几个到几十个。在ERP系统操作中,一般每个操作所耗资源量不大,主要为一些结构性数据的查询和分析。为此我们在本ERP系统中需要一个支持大并发,小数据流的高性能数据库服务器平台来承载ERP系统的应用。
在服务器硬件方面,由于并发访问ERP系统的用户数较多,要求系统带宽不能成为整个应用的瓶颈,还要求系统具有极强的处理能力,及很高的并发性。在数据存储方面要求有巨大的磁盘空间和巨大的扩展性以及高速的数据传输标准以满足数据库的需求。
因为ERP承载了整个企业的关键性任务,所以选择一个优秀的硬件是非常重要事情。为了选择符合应用的硬件平台,我们详细研究了多个ERP系统的运行特点,并从以下几方面来衡量其整体性能,然后依据以下分析选择相应的最佳方案:
(1)企业级计算性能
企业ERP信息系统的工作内容大多是数据密集型操作,数据来源相当广泛,种类繁多,数据库和各类应用都面临着数据采集、数据集中、数据查询等数据密集型操作,同时还面临着OLAP(联机分析处理)和建立决策支持数据仓库的需要,因此,服务器系统强劲的CPU数据处理能力和扩展能力就十分重要。在中小企业应用中,一般选择2路或者双核处理器的服务器,配备2GB大内存,就可以满足需要,如果是规模更大的应用,则建议配置4路处理器或者以上性能的高性能服务器了。
(2)高度的可靠性和可用性
数据库和各类应用每天都面临着大量数据的收集和处理,服务器系统的冗余容错能力提供了高可靠性和可用性,再辅之高可用性方案设计,才可充分保证企业ERP信息系统工作的不间断进行。像服务器的冗余电源、内存镜像等设计都可以考虑。
(3)极佳的稳定性
作为企业ERP信息系统的支撑平台,需要保证服务器系统能持续、高效、稳定的运行,以减少对服务器系统的管理和维护的时间和工作量,以及计划外停机时间。稳定性依赖于软硬件的兼容性和各自的稳定性设计。
(4)对数据的高保护性
不言而喻,对于数据就是生命的企业ERP信息系统来讲,数据在服务器系统中进行计算、存储和网络传输时,其完整性、有效性是必须保证的。对于有机密要求的数据,还要保证数据的机密性。
在ERP与数据库系统同时部署在一台机器上的小型系统可以将数据存储在本机上,如果ERP系统与数据库系统分离,则可在数据库服务器后挂载专用存储设备来存储数据,保证数据的安全。
(5)良好的管理性
在企业ERP信息系统中各种网络设备、计算机设备、安全设备种类繁多,这对整个系统的管理和控制提出了很大挑战。就服务器系统而言,专业服务器系统管理软件对服务器系统的集中和可视化管理,将使网络计算环境管理变得简单易行。

7、是服务器容错

容错服务器请咨询武汉鑫远动实业有限公司
邮箱[email protected]
建议:容错服务器只有两家在做:美国容错公司和日本NEC
其他品牌的都是普通服务器,可以实现容错功能,但是是需要其他的连接方法,当然性能可靠也不能与本来的容错服务器相比,请谨慎咨询
容错服务器都是需要项目报备的,不可能给你直接报价,就算报价了也是天价

8、容错技术的容错技术的历史

上世纪80年代,第一代容错技术就开始进入商用领域。美国Stratus(容错公司)在Stratus独特的硬件级容错技术及VOS专有操作系统环境下,采用了Motorola M68000处理器。
1993年,英特尔 I860处理器在Stratus的硬件级容错体系结构中成功应用,在软件环境方面,还能满足业界对开放性要求的Unix操作系统FTX,即AT&T UNIX SVR4。
1996年,容错技术得到HP的支持,共同推出Stratus Continuum系列,将Stratus容错结构结合HP PA-RISC对称多处理技术。
进入21世纪以来,制造、中小企业、能源、交通等领域对服务器,特别是中低端IA服务器的需求激增,过去仅仅可以应用在RISC平台、HP-UX环境下的容错产品也面临着新的挑战。另一方面,企业越来越依赖信息系统来完成关键业务的应用,同时他们不可能配备更多的专业人员来进行专职维护。双机热备、集群服务器遇到难题。
如今:NEC通过与美国容错公司多年的合作,于2001年推出了业界第一台基于IA架构、支持Microsoft Win-dows Server 2000标准操作系统环境的容错服务器。NEC的Express5800/ft系列在Windows及Linux平台上的可靠性达到了99.999%,这种实时保护技术来源于STRATUS连续处理技术(Fundamentals of Continuous Pro-cessing Design),它包括: FAILSAFE 软件和LOCKSTEP技术运行一样,可防止很多软件错误和储运耗损。该软件在Windows 2000/2003环境下采用热插拔、内存镜像、负载均衡、多点终止失效、多通道I/O等方式,大大增强了系统连续运行的稳定性。
FAILSAFE可以管理和诊断特征捕获,分析和通报服务器的软件问题,从而允许个人在软件发生错误之前去纠正错误。FAILSAFE软件的下列功能增强了NEC Express5800/ft系统在Windows环境中的可靠性:保护短暂的硬件故障;通过增强的驱动程序预防软件失效;软件问题的捕获、分析及修正;内存数据的连续性维持;丰富的纠错功能可以解决各种不同的错误。为了避免物理撞击等意外故障,安全故障软件还提供了自动重启功能,能够将宕机前CPU与内存数据即时保存下来,最大限度地避免数据的意外丢失。 当然,假如容错服务器的硬件发生永久性故障,尽管系统能够正常运行,也必须及时更换硬件才能维持容错的冗余架构。容错服务器都配备了简易直观的图形界面来管理监测工具,(如NECExpress5800/ft提供了ESMPRO 管理软件),能够对服务器中硬件运行及故障状态进行适时监控。

9、什么是系统容错?

双机容错系统方案
一,双机容错系统方案综述
1.1 久强世纪 Storage Solution 双机容错系统
近年来,随着计算机技术的飞速发展,服务器的性能有了大幅度的提升,服务器作为处理关键性事物
的业务主机已随处可见.对于要求有高可用性和高安全性的系统,比如金融,邮电,交通,石油,电力,
保险证券等行业,用户提出了系统容错的要求.久强世纪公司推出基于Cluster集群技术的双机互备援解
决方案,包括用于对双服务器实行监控的HA 容错软件和作为数据存储设备的系列磁盘阵列系统.通过软
硬件两部分的紧密配合,提供给客户一套具有单点故障容错能力,且性价比优越的用户应用系统运行平台.
1.2 Cluster集群技术
Cluster集群技术:一组相互独立的服务器在网络中表现为单一系统,并以单一系统的模式加以管理.
此单一系统为客户工作站提供高可靠性的服务.
Cluster大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可
被所有的网络客户所使用.Cluster必须可以协调管理各分离的组件的错误和失败,并可透明的向Cluster
中加入组件.
一个Cluster包含多台(至少二台)拥有共享数据储存空间的服务器.任何一台服务器运行一个应用
时,应用数据被存储在共享的数据空间内.每台服务器的操作系统和应用程序文件存储在其各自的本地储
存空间上.
Cluster内各节点服务器通过一内部局域网相互通讯.当一台节点服务器发生故障时,这台服务器上
所运行的应用程序将在另一节点服务器上被自动接管.当一个应用服务发生故障时,应用服务将被重新启
动或被另一台服务器接管.当以上任一故障发生时,客户将能很快连接到新的应用服务上.
1.3久强世纪 Storage Solution 双机容错系统方案
Cluster集群可由N台服务器组成,当Cluster最小值N=2时,即为双机容错集群系统.
久强世纪Cluster双机容错系统结合了磁盘阵列产品的安全可靠性与HA监控软件技术的优点,将二
者的优势相互配合.使用软件与磁盘阵列结合的方案,可以有效提高主机工作效率,减轻服务器和网络设
备压力,保证系统稳定性.

二,系统概述

2.1 功能概述
·如果硬盘发生故障时,磁盘阵列柜会有蜂鸣声告警,同时硬盘架面板上的状态指示灯变成红色(正
常时为绿色),以便提醒用户进行及时有效的维护
·独特的硬盘保护环路设计,可以确保故障硬盘插拔时,即刻隔断与SCSI总线的连接,而不会影响
SCSI总线上的信号
·即时响应: 控制器在硬盘发生故障时即刻识别错误信息
·支持环境监控(当机箱内温度过高时会有蜂鸣告警声)
·冗余电源备份(支持热插拔)
·热插拔风扇
·系统安全密码锁定
·当柜门关闭时,仍可观察到控制器及硬盘工作状态
·支持不同品牌,容量,型号的SCSI硬盘
2.2 阵列柜结构

AccuSTOR S940阵列柜的组成包括RAID控制器,双电源保护装置,支持热插拔的硬盘盒(Mobile Rack)
等,大部分部件具有冗余能力,可以全面保护硬盘和数据的安全.
AccuSTOR S940的RAID控制器使用64-bit RISC处理器,基本缓存(CACHE)为64MB, 控制器提供4个
通道(Channel),其中两个为主机通道(Host Channel),2个为设备通道(Disk Channel),可同时接驳8块
硬盘,最大RAID5容量为7X146GB=1.02TB.
在控制器中,可以方便的给设置0,1,3,5,0+1级的RAID组.控制器带有Monitor接口,用户可
以通过该接口使用终端或终端仿真程序进行设置,可以对控制器的BIOS程序进行升级.
在阵列柜的顶部预留一个插槽,用户可以选装一个备份RAID控制器,以提高系统的可靠性.
AccuSTOR S940或内部与SCSI硬盘的接口是采用SCA-2规格的整体式后背板,可以直接使用80Pin
热插拔硬盘,配备转换口后,也可使用80Pin Ultra2/Ultra160硬盘.每一硬盘插槽配有隔绝保护IC,以
消除硬盘在热插时的电流负效应,避免瞬间电流造成对硬盘或控制器的损害.
AccuSTOR S940阵列柜安装双份热插拔电源,每个电源的功率300W,通过调整电压开关该电源可以在
110/220V电压下工作.
正常情况下,双电源在Share状态工作,各输出150W功率,保证电源的使用寿命.如果其中一只电
源发生故障,另一电源将自动转换到300W 输出功率状态,使阵列继续正常运转.同时系统将通过液晶屏
幕和蜂鸣方式发出警报,用户可以将损坏的电源直接拔除,而不必关闭阵列.
机箱后背板上装有四个热插拔冷却风扇,风扇的启动温度和转速受ENC控制,用户可以通过ENC上的

DIP开关进行设定.所有风扇均采用德国标准的三钢珠结构,使其使用寿命大大延长.
阵列柜中安置有8个硬盘盒,可以接驳80针Ultra2/Ultra160 SCSI硬盘和SCA硬盘,普通硬盘接入
阵列后,即支持热插拔功能.Mobile Rack可自动为硬盘设置ID,前面板上有指示灯,可以显示硬盘的工
作状态.
阵列柜后面板上装有HOST-A,HOST-B接口各两个,用来接驳主机.Monitor口可接至终端或PC机,
用来进行阵列的设置.Modem口可以接驳调制解调器,用于传真和Pager方式的远程报警.UPS口可连接
UPS电源,当断电时UPS系统会送出一PowerFail信号到此UPS接口上,此时磁盘阵列控制器会即刻将缓
存(Cache)的资料完整地写入磁盘中,并关闭缓存,如服务器再有资料传来则会直接写入硬盘内,直到电
源恢复正常.两个设备通道接口配备终结器,用户可以串联机柜或其他SCSI设备.
2.3 双机容错系统软件 HA
久强世纪 Storage Solution双机容错系统解决方案提供专用双机软件:HA.
HA For NT 作为目前市场上最为成熟的双机容错软件,以其友好图形操作界面,方便的配置与管理被
广泛应用于政府,学校,电信,电力,石油,交通等行业.
通过装在两个服务器中的双机热备份应用软件HA,系统具有在线容错能力,即当处于工作状态的服
务器无法正常工作时,通过双机系统容错软件,使处于守候监护状态的另一台服务器迅速接管不正常服务
器上的业务程序及数据资料,使得网络用户的业务交易正常运行,保证交易数据的完整一致性及交易业务
的高可靠性.
通过架设与两台服务器间的侦测网络,HA for NT软件能够对两台服务器的软硬件运行状态实行监控.
HA For NT具有两种工作模式:
Hot Standby:即双机热备份,两台服务器为生产机--备份机关系.当生产机发生故障时,备份机自
动接管生产机的任务和数据,使拥护业务交易正常运行.使用者可在最短时间内回复作业,使客户的应用
不必中断,减少主机停机所造成的损失.
Daul Active:即双机互备援.两台服务器各运行不同的应用任务,并互相作为备份机.当两部主机
中任一主机当机时,另一部主机可迅速接替故障主机任务.
三,系统整合
久强世纪 Storage solution双机容错系统是由HA容错软件与磁盘阵列有机组合的成熟方案.整个
系统的组合架构工作包括三个方面:
1)硬件系统的连接
2)容错软件的安装和配置
3)与用户应用的整合
3.1 硬件系统的连接
硬件部分的连接主要包括磁盘阵列与主机的连接和侦测网络的连接.
用户可以将支持多主机的磁盘阵列系统分别连接至两台服务器的SCSI接口. 磁盘阵列系统提供两条
标准68Pin外接SCSI电缆,可与任何服务器的Ultra 3 SCSI接口接驳.用户不需要在服务器上增加任何
硬件设备或驱动程序.磁盘阵列连接至主机后,用户可以象增加普通硬盘那样对其进行分区,格式化,安
装文件系统等操作.
HA for NT可使用三种侦测网络.
RS232线路:只需使用软件附带的专用电缆将两台服务器的串口连接即可;

TCP/IP:使用直连网线或通过交换设备(Switch或Hub)连接两台服务器的网卡;
Share Disk:在磁盘阵列柜上设置双主机共享的8MB分区;
以上三种侦测网络可同时使用,互为备份,有利于提高双机系统的可靠性.
3.2 容错软件的安装和配置
HA容错软件的安装简单快捷.整个安装过程中,用户不需要进行繁琐的安装选择,或更改服务器硬
件配备或操作系统设定与容错软件配合.
HA for NT具有友好图形用户界面(GUI),使容错软件的配置管理成为轻松的工作.
3.3 与用户应用的整合
久强世纪 Storage solution双机容错控制系统能够提供具有相当容错能力的应用系统平台.它既可
以同所有大型数据库配合使用,也可监管用户自主开发的应用软件.在与容错系统整合时,只需将数据库
系统分别在两台服务器安装,并将数据文件放置于共享的磁盘阵列即可,而不需要对应用程序进行任何更
改.

10、容错服务器和冗余服务器的区别

冗余:指重复配置系统的一些部件,当系统发生故障时,冗余配置的部件介入并承担故障部件的工作,由此减少系统的故障时间。通常指通过多重备份来增加系统的可靠性
容错:是用冗余的资源使计算机具有容忍故障的能力,即在产生故障的情况下,仍有能力将指定的算法继续完成。
容错主要依靠冗余设计来实现,它以增加资源的办法换取可靠性。由于资源的不同,冗余技术分为硬件冗余、软件冗余、时间冗余和信息冗余。硬件冗余是通过硬件的重复使用来获得容错能力。软件冗余的基本思想是用多个不同软件执行同一功能,利用软件设计差异来实现容错。信息冗余是利用在数据中外加的一部分信息位来检测或纠正信息在运算或传输中的错误而达到容错。在通信和计算机系统中,常用的可靠性编码包括:奇偶校验码、循环冗余码CRC、汉明码等。

与容错服务器相关的知识