システム冗長化とノード障害耐性

Awanio は あらゆるアーキテクチャレイヤーで冗長性 を確保するよう設計されており、いずれか 1 つのコンポーネントが故障しても ダウンタイムを発生させず、性能を劣化させない ことを目指しています。

冗長化の機能

  • 多層冗長化
    管理サーバー、ネットワーク、ストレージ、コンピュートノード全体に冗長性を実装します。

  • 自動フェイルオーバー
    ワークロード(VM、コンテナ、サービス)は手動介入なしで健全なノードへ自動移行されます。

  • ノード冗長(少なくとも 1 ノード故障に耐える設計)
    各クラスタは、1 台のノードが利用不能になっても通常運用を継続できるよう設計されています。

  • 動的負荷の再分散
    障害ノードの負荷は、稼働中ノードに自動的に分散されます。


利点

  • 高可用性とサービス継続性を保証
  • 単一障害点(SPOF)を排除
  • ハードウェア障害時も一貫した性能を維持

技術アーキテクチャ

Awanio はデータをレプリケーションファクター(RF)3(デフォルト)で保存します。つまり、各データブロックは 3 つの異なるノードに保存されます。これにより、1〜2 台のノードが故障してもデータの可用性が維持されます。Awanio の管理レイヤーは、ノードの健全性とワークロード分散を継続的に監視します。

Awanio のクラスタアーキテクチャでは、RF に合わせて最小 3 ノード構成を採用し、各ノードはコンピュートとストレージの両方の役割を担います。仮想マシン(VM)は Awanio の仮想化レイヤー上で稼働し、VM のデータはすべて Ceph 分散ストレージのプールに保存されます。


フェイルオーバーのシミュレーション – 3 ノードクラスタ

|| Node Down | Node Active | Ceph Status | VM Status | Service Status | Description | || --------- | ---------- | ----------- | ------------- | ----------------- | ------------- | || 0 | 3 | RF=3 | Normal | Normal | Ideal | || 1 | 2 | RF=2 | Auto failover | Still running | Safe | || 2 | 1 | RF=1 | Unstable | Risk of down | CRITICAL | || 3 | 0 | - | - | DOWN | Total failure |