1.1 明確RTO(恢復時間目標)與RPO(恢復點目標),例如RTO=1小時、RPO=15分鐘。
1.2 分層備份:熱備(快照/同步)、溫備(增量備份)、冷備(離線備份)。
1.3 多地備援:台北主站、台中或高雄異地備援,以及雲端跨區(如AWS/TW region或S3相容物件)。
1.4 軟體選型依據:資料類型(資料庫、檔案、虛機、容器)決定工具(例:mysqldump/XtraBackup、restic、Veeam、Velero)。
1.5 自動化與驗證:每日自動備份、每週還原演練、備份完整性校驗(checksum),並把報表納入監控系統。
2.1 rsync:適用檔案同步與簡單增量備份,優點是輕量與廣泛支援。
2.2 restic / Borg:支援加密與去重,適合對象存儲(S3、MinIO)作為備份目標。
2.3 Percona XtraBackup 或 mysqldump:MySQL/MariaDB一致性備份,XtraBackup適合線上熱備。
2.4 Veeam Agent / Acronis:Windows/VM層級備份與還原,企業級GUI與排程。
2.5 Proxmox Backup Server:虛機層級的備份解決方案,適合自建虛擬化平台(KVM/LXC)。
2.6 Velero:Kubernetes集群備份(PV+namespace+CRD),支援雲端快照與物件儲存。
3.1 優先選擇在台灣有機房/POP的CDN供應商,減低延遲並能夠配合災時流量切換。
3.2 DDoS防護:結合雲端(如Cloudflare、Akamai、各大雲的DDoS Shield)與機房ACL,務必做流量黑洞與淨化策略。
3.3 頻寬與帶寬保留:為備援與資料同步保留額外頻寬,例如每天6:00–10:00為主備同步窗口。
3.4 DNS與域名策略:使用多重DNS供應商與短TTL(如60秒)以便快速切換。
3.5 監控與告警:整合Zabbix/Prometheus + Grafana監控備份成功率、磁碟使用率與網路延遲。
4.1 背景:某台灣電商(月PV約1千萬)主機位於台北中華電信機房,要求RTO<2小時、RPO<30分鐘。
4.2 架構方案:主資料庫主從複製(主台北、從高雄),每日binlog增量備份到S3相容儲存(MinIO)。
4.3 備份工具:MySQL使用Percona XtraBackup作全量+增量,檔案使用restic推送至S3。
4.4 DDoS與CDN:結合Cloudflare CDN與本地供應商加速,並在電商大促期間啟用額外WAF規則與速率限制。
4.5 成果與演練:在一次機房電力事故中,災切至高雄備援機房,故障轉移時間約90分鐘,資料丟失小於15分鐘。
5.1 下表示範主/備伺服器配置與備份窗口、RTO/RPO數據,供參考與規劃。
5.2 表格內容居中,表格邊框寬度為1,且文字皆置中展示。
5.3 可依流量成長動態擴充CPU/記憶體或切換至雲端自動擴容。
5.4 建議I/O敏感型服務採用NVMe或企業級SSD,並配置RAID或ZFS以保資料完整性。
5.5 建議每月執行一次完整還原演練並記錄耗時與異常。
| 角色 | 地點 | CPU | RAM | 磁碟 | 網路 | 備份方式 | RTO / RPO |
|---|---|---|---|---|---|---|---|
| 主伺服器 | 台北機房 | 8 vCPU | 32 GB | 2 x 1TB NVMe (RAID1) | 1 Gbps | XtraBackup 全+增量,rsync 檔案 | 1.5 小時 / 15 分鐘 |
| 異地備援 | 高雄機房 | 8 vCPU | 32 GB | 2 x 1TB SSD (RAID1) | 500 Mbps | binlog 同步 + restic 到 S3 | 2 小時 / 15 分鐘 |
| 冷備/物件存儲 | 雲端 (S3) | - | - | 物件儲存 | 依ISP | restic / MinIO,30天保留 | 24 小時 / 1 小時 |
6.1 檔案備份:rsync(同步)+restic(去重、加密)+S3作長期保存。
6.2 資料庫:主從實時複寫 + 周期性XtraBackup全量+增量備份。
6.3 VM/Hypervisor:Proxmox Backup Server或Veeam做整體虛機快照與還原測試。
6.4 容器/K8s:Velero備份PV與cluster資源,快照存放至物件儲存。
6.5 自動化:使用Ansible做部署、使用Rundeck/Cron排程與Webhook通知備份結果至Slack/Teams。
7.1 每月還原演練:包含資料庫回復、應用程式啟動與流量切換,並紀錄實際RTO。
7.2 成本控管:評估本地機房頻寬成本與雲端儲存費用,選擇熱/冷資料分層儲存以降低費用。
7.3 SLA與合約:與機房/ISP簽訂SLA、確保電力與網路冗餘。
7.4 安全性:備份資料加密(at-rest與in-transit),並限制存取權限與金鑰管理。
7.5 預案文件:建立標準作業流程(SOP),並定期更新與培訓運維團隊。