Tolerância ao erro

Definição - o que significa tolerância a falhas?

A tolerância a falhas é a maneira pela qual um sistema operacional (SO) responde a uma falha de hardware ou software. O termo se refere essencialmente à capacidade de um sistema de permitir falhas ou mau funcionamento, e essa capacidade pode ser fornecida por software, hardware ou uma combinação de ambos. Para lidar com as falhas normalmente, alguns sistemas de computador possuem dois ou mais sistemas duplicados.

Definirtec explica a tolerância a falhas

O software de tolerância a falhas pode fazer parte da interface do sistema operacional, permitindo ao programador verificar os dados críticos em pontos específicos durante uma transação.

A tolerância a falhas pode incluir:

  • Respondendo a uma falha de energia (o nível mais baixo de tolerância a falhas)
  • Usar imediatamente um sistema de backup em caso de falha do sistema
  • Permitir que discos espelhados assumam imediatamente o controle de um disco com falha
  • Vários processadores trabalhando juntos e comparando os dados e a saída em busca de erros, corrigindo imediatamente os erros detectados.

Em geral, 100% de tolerância a falhas nunca pode ser alcançada devido a restrições de custo.