电脑技术汇总_电脑技术网_电脑技术官网

电脑知识网 > 电脑故障 > 硬件故障 > 正文

一文读懂容错与冗余技术

网络整理 2018-04-19 07:08

容错控制的研究虽然面临着空前的挑战,但近些年来,相关研究领域,如鲁棒控制理论,模糊控制,神经网络控制研究的不断深入和发展,也给容错控制的研究带来了良好的机遇,提供了充分的条件。

而计算机控制技术、人工智能等技术的飞速发展,使得容错控制技术在实际工程中应用的可能性变得越来越大。

一文读懂容错与冗余技术

容错概念的由来

所谓容错:就是容许错误,是指设备的一个或多个关键部分发生故障时,能够自动地进行检测与诊断,并采取相应措施,保证设备维持其规定功能,或牺牲性能来保证设备在可接受范围内继续工作。

错误一般分为两类:第一类是先天性的固有错,如元器件生产过程中造成的错、线路与程序在设计过程中产生的错。这一类的错误需对其拆除、更换或修正,是不能容忍的。第二类是后天性的错,它是由于设备在运行中产生了缺陷所导致的故障。这种故障有瞬时性、间歇性和永久性的区别。 

容错技术是提高系统可靠性的重要途径。常采用的容错方法有硬件容错、软件容错、信息容错和时间容错。

提高系统的可靠性一般有两种办法:1、采用缜密的设计和质量控制方法来尽量减少故障出现的概率。2、以冗余资源为代价来换取可靠性。

利用前一种方法来提高系统的可靠性是有限的,要想进一步的提高必须采用容错技术。

容错控制技术在国外发展的比较早,是计算机奠基人之一,美籍匈牙利数学家冯•诺依曼提出的。随着八十年代微型计算机的迅速发展和广泛应用,容错技术也得到了飞速的发展,容错技术被应用到各个环境中。

我国的容错技术现在发展的也很迅速,一些重要的工作场合如航天、电厂等现在都采用了容错技术。

1、 智能容错的定义

智能容错IFT(Intelligent Fault-Tolerance):就是设备在运行过程中一个或多个关键部件发生故障或即将发生故障之前,利用人工智能理论和方法,通过采取有效措施,对故障自动进行补偿、抑制、消除、修复,以保证设备继续安全、高效、可靠运行,或以牺牲性能损失为代价,保证设备在规定的时间内完成其预定功能。

硬件智能容错 HIFT (Hardware Intelligent Fault Tolerant) 主要采用硬件冗余技术。其基本思想是对设备的关键部件配备多重相似或相同部件,一旦检测和诊断出设备发生故障就可以立刻切换到备份部件,以达到故障容错的目的。

一文读懂容错与冗余技术

二冗余结构原理图

2、硬件智能容错方式的分类

硬件智能容错按其工作方式可以分为:静态冗余、动态冗余和混合冗余。

静态冗余容错是通过表决和比较屏蔽系统中出现的故障,如图

一文读懂容错与冗余技术

三模冗余(静态冗余)TMR系统结构图

静态冗余容错的主要特点是:

(1)由于故障被屏蔽,所以不需要识别故障;

(2)容易与无冗余系统进行转换;

(3)所有模件都消耗能量。

动态冗余的主要方式是多重模块相继运行来维持设备正常工作。当检测到工作模块出现故障时,一个备用模块立即接替故障模块并投入工作。

动态冗余容错控制的主要特点是:

(1)仅有一个模件消耗能量;

(2)模件数目可随任务而改变,不会影响系统工作;

(3)转换装置和检测装置中任一故障都会导致系统失效。

一文读懂容错与冗余技术

动态冗余容错控制结构图

混合冗余兼动态冗余和静态冗余之所长,通常用H(n,k)来表示,如下图所示。图中的V为表决器,n表示模块的总数,k代表以表决方式实现静态冗余的模块数,而其余N-K个模块则作为表决系统中模块的备份。当参与表决的k个模块中(通常k>=3)有一个模块出现故障时,备份就替代该模块参与表决,维持静态冗余系统的完整。当所有备份都被替换完后,系统就成为一般的表决系统。

如在硬件构成的逻辑系统中表决器是由开关电路实现的,而软件中表决需要通过软件断言SA(Software Assertions)来实现。软件断言就是当软件在宿主系统中运行时,对其进程或功能的正确与否做出判断的条件。

一文读懂容错与冗余技术

H(n,k)系统结构

3、智能容错的实现方法

智能容错的实现方法分为: (1)故障信号检测;(2)故障特征识别;(3)故障状态预测;(4)故障维修决策;(5)故障容错控制。

Tags:容错(1)冗余(1)二冗余(1)三模冗余(1)

转载请标注:电脑技术网——一文读懂容错与冗余技术

搜索
网站分类
标签列表