首頁技術(shù)文章正文

java培訓(xùn)之Redis持久化教程

更新時(shí)間:2020-03-15 來源:黑馬程序員 瀏覽量:

1.1. Redis 持久化方式

1.1.1. RDB快照

1.1.1.1. 概述

在默認(rèn)情況下, Redis 將數(shù)據(jù)庫快照保存在名字為 dump.rdb的二進(jìn)制文件中。你可以對(duì) Redis 進(jìn)行設(shè)置, 讓它在“ N 秒內(nèi)數(shù)據(jù)集至少有 M 個(gè)改動(dòng)”這一條件被滿足時(shí), 自動(dòng)保存一次數(shù)據(jù)集。

你也可以通過調(diào)用 SAVE或者 BGSAVE , 手動(dòng)讓 Redis 進(jìn)行數(shù)據(jù)集保存操作。 比如說, 以下設(shè)置會(huì)讓 Redis 在滿足“ 60 秒內(nèi)有至少有 1000 個(gè)鍵被改動(dòng)”這一條件時(shí), 自動(dòng)保存一次數(shù)據(jù)集:

save 60 1000

這種持久化方式被稱為快照 snapshotting.

1584285783465_Redis-持久化.jpg

1.1.1.2. 何時(shí)執(zhí)行快照

出現(xiàn)下面的情況redis會(huì)快照內(nèi)存里的數(shù)據(jù)

1. 用戶發(fā)送bgsave命令(此時(shí)redis會(huì)fork一個(gè)子進(jìn)程,子進(jìn)程負(fù)責(zé)生成硬盤文件,父進(jìn)程負(fù)責(zé)繼續(xù)接受命令)

2. 用戶發(fā)送save命令(和bgsave命令不同,發(fā)送save命令后,到系統(tǒng)創(chuàng)建快照完成之前系統(tǒng)不會(huì)再接收新的命令,換句話說save命令會(huì)阻塞后面的命令,而bgsave不會(huì))

3. 用戶在配置文件了配置了類似這樣的命令 save 60 1000

4. 這個(gè)的意思是說,自從上次快照成功算起,如果滿足"60秒內(nèi)有1000次寫入"這個(gè)條件,系統(tǒng)就自動(dòng)調(diào)用bgsave,如果配置文件里有多個(gè)save命令,只有滿足一個(gè)就調(diào)用bgsave命令

5. 用戶發(fā)送shutdown,系統(tǒng)會(huì)先執(zhí)行save命令阻塞客戶端,然后關(guān)閉服務(wù)器

6. 當(dāng)有主從架構(gòu)時(shí),從服務(wù)器向主服務(wù)器發(fā)送sync命令來執(zhí)行復(fù)制操作時(shí),只有主服務(wù)器當(dāng)時(shí)沒有進(jìn)行bgsave操作,那么主服務(wù)器就會(huì)執(zhí)行bgsave操作。推薦了解java培訓(xùn)課程。

1.1.1.3.快照的配置信息

save 60 1000

stop-writes-on-bgsave-error no

rdbcompression yes

dbfilename dump.rdb

dir ./

1.1.1.4.工作方式

當(dāng) Redis 需要保存 dump.rdb 文件時(shí), 服務(wù)器執(zhí)行以下操作:

·Redis 調(diào)用forks. 同時(shí)擁有父進(jìn)程和子進(jìn)程。

·子進(jìn)程將數(shù)據(jù)集寫入到一個(gè)臨時(shí) RDB 文件中。

·當(dāng)子進(jìn)程完成對(duì)新 RDB 文件的寫入時(shí),Redis 用新 RDB 文件替換原來的 RDB 文件,并刪除舊的 RDB 文件。這種工作方式使得 Redis 可以從寫時(shí)復(fù)制(copy-on-write)機(jī)制中獲益。

1.1.2. 只追加操作的文件(Append-only file,AOF)

1.1.2.1. 概述

快照功能并不是非常耐久(dura ble): 如果 Redis 因?yàn)槟承┰蚨斐晒收贤C(jī), 那么服務(wù)器將丟失最近寫入、且仍未保存到快照中的那些數(shù)據(jù)。 從 1.1 版本開始, Redis 增加了一種完全耐久的持久化方式: AOF 持久化。

你可以在配置文件中打開AOF方式:

appendonly yes

從現(xiàn)在開始, 每當(dāng) Redis 執(zhí)行一個(gè)改變數(shù)據(jù)集的命令時(shí)(比如 SET), 這個(gè)命令就會(huì)被追加到 AOF 文件的末尾。這樣的話, 當(dāng) Redis 重新啟時(shí), 程序就可以通過重新執(zhí)行 AOF 文件中的命令來達(dá)到重建數(shù)據(jù)集的目的。


1.1.2.2. 日志重寫

因?yàn)?AOF 的運(yùn)作方式是不斷地將命令追加到文件的末尾, 所以隨著寫入命令的不斷增加, AOF 文件的體積也會(huì)變得越來越大。舉個(gè)例子, 如果你對(duì)一個(gè)計(jì)數(shù)器調(diào)用了 100 次 INCR , 那么僅僅是為了保存這個(gè)計(jì)數(shù)器的當(dāng)前值,AOF 文件就需要使用 100 條記錄(entry)。然而在實(shí)際上, 只使用一條 SET 命令已經(jīng)足以保存計(jì)數(shù)器的當(dāng)前值了, 其余 99 條記錄實(shí)際上都是多余的。

為了處理這種情況, Redis 支持一種有趣的特性: 可以在不打斷服務(wù)客戶端的情況下, 對(duì) AOF 文件進(jìn)行重建(rebuild)。執(zhí)行 BGREWRITEAOF 命令, Redis 將生成一個(gè)新的 AOF 文件, 這個(gè)文件包含重建當(dāng)前數(shù)據(jù)集所需的最少命令。Redis 2.2 需要自己手動(dòng)執(zhí)行 BGREWRITEAOF 命令; Redis 2.4 則可以自動(dòng)觸發(fā) AOF 重寫, 具體信息請(qǐng)查看 2.4 的示例配置文件。


1.1.2.3. AOF有多耐用

你可以配置 Redis 多久才將數(shù)據(jù) fsync 到磁盤一次。有三種方式:

·每次有新命令追加到 AOF 文件時(shí)就執(zhí)行一次 fsync :非常慢,也非常安全

·每秒 fsync 一次:足夠快(和使用 RDB 持久化差不多),并且在故障時(shí)只會(huì)丟失 1 秒鐘的數(shù)據(jù)。

·從不 fsync :將數(shù)據(jù)交給操作系統(tǒng)來處理。更快,也更不安全的選擇。

·推薦(并且也是默認(rèn))的措施為每秒 fsync 一次, 這種 fsync 策略可以兼顧速度和安全性。


1.1.2.4.如果AOF文件損壞了怎么辦?

服務(wù)器可能在程序正在對(duì) AOF 文件進(jìn)行寫入時(shí)停機(jī), 如果停機(jī)造成了 AOF 文件出錯(cuò)(corrupt), 那么 Redis 在重啟時(shí)會(huì)拒絕載入這個(gè) AOF 文件, 從而確保數(shù)據(jù)的一致性不會(huì)被破壞。當(dāng)發(fā)生這種情況時(shí), 可以用以下方法來修復(fù)出錯(cuò)的 AOF 文件:

1. 為現(xiàn)有的 AOF 文件創(chuàng)建一個(gè)備份。

2. 使用 Redis 附帶的 redis-check-aof 程序,對(duì)原來的 AOF 文件進(jìn)行修復(fù):

redis-check-aof –fix

3. (可選)使用 diff -u 對(duì)比修復(fù)后的 AOF 文件和原始 AOF 文件的備份,查看兩個(gè)文件之間的不同之處。

4. 重啟 Redis 服務(wù)器,等待服務(wù)器載入修復(fù)后的 AOF 文件,并進(jìn)行數(shù)據(jù)恢復(fù)。


1.1.2.5.AOP重寫原理

AOF 重寫和 RDB 創(chuàng)建快照一樣,都巧妙地利用了寫時(shí)復(fù)制機(jī)制:

·redis 執(zhí)行 fork() ,現(xiàn)在同時(shí)擁有父進(jìn)程和子進(jìn)程。

·子進(jìn)程開始將新 AOF 文件的內(nèi)容寫入到臨時(shí)文件。

·對(duì)于所有新執(zhí)行的寫入命令,父進(jìn)程一邊將它們累積到一個(gè)內(nèi)存緩存中,一邊將這些改動(dòng)追加到現(xiàn)有 AOF 文件的末尾,這樣樣即使在重寫的中途發(fā)生停機(jī),現(xiàn)有的 AOF 文件也還是安全的。

·當(dāng)子進(jìn)程完成重寫工作時(shí),它給父進(jìn)程發(fā)送一個(gè)信號(hào),父進(jìn)程在接收到信號(hào)之后,將內(nèi)存緩存中的所有數(shù)據(jù)追加到新 AOF 文件的末尾。

搞定!現(xiàn)在 Redis 原子地用新文件替換舊文件,之后所有命令都會(huì)直接追加到新 AOF 文件的末尾。


1.1.3.怎樣從RDB方式切換為AOF方式

在 Redis 2.2 或以上版本,可以在不重啟的情況下,從 RDB 切換到 AOF :

·為最新的 dump.rdb 文件創(chuàng)建一個(gè)備份。

·將備份放到一個(gè)安全的地方。

·執(zhí)行以下兩條命令:

-redis-cli config set appendonly yes

redis-cli config set save ""

·確保寫命令會(huì)被正確地追加到 AOF 文件的末尾。

·執(zhí)行的第一條命令開啟了 AOF 功能: Redis 會(huì)阻塞直到初始 AOF 文件創(chuàng)建完成為止, 之后 Redis 會(huì)繼

續(xù)處理命令請(qǐng)求, 并開始將寫入命令追加到 AOF 文件末尾。

執(zhí)行的第二條命令用于關(guān)閉 RDB 功能。 這一步是可選的, 如果你愿意的話, 也可以同時(shí)使用 RDB 和 AOF 這兩種持久化功能。

重要:別忘了在 redis.conf 中打開 AOF 功能! 否則的話, 服務(wù)器重啟之后, 之前通過 CONFIG SET 設(shè)置的配置就會(huì)被遺忘, 程序會(huì)按原來的配置來啟動(dòng)服務(wù)器。


1.1.4. AOF和RDB之間的相互作用

在版本號(hào)大于等于 2.4 的 Redis 中, BGSAVE 執(zhí)行的過程中, 不可以執(zhí)行 BGREWRITEAOF 。 反過來說, 在BGREWRITEAOF 執(zhí)行的過程中, 也不可以執(zhí)行 BGSAVE。這可以防止兩個(gè) Redis 后臺(tái)進(jìn)程同時(shí)對(duì)磁盤進(jìn)行大量的I/O 操作。

如果 BGSAVE 正在執(zhí)行, 并且用戶顯示地調(diào)用 BGREWRITEAOF 命令, 那么服務(wù)器將向用戶回復(fù)一個(gè) OK 狀態(tài),并告知用戶, BGREWRITEAOF 已經(jīng)被預(yù)定執(zhí)行: 一旦 BGSAVE 執(zhí)行完畢, BGREWRITEAOF 就會(huì)正式開始。 當(dāng)Redis 啟動(dòng)時(shí), 如果 RDB 持久化和 AOF 持久化都被打開了, 那么程序會(huì)優(yōu)先使用 AOF 文件來恢復(fù)數(shù)據(jù)集, 因?yàn)锳OF 文件所保存的數(shù)據(jù)通常是最完整的。


1.1.5. AOF VS RDB

RDB持久化方式能夠在指定的時(shí)間間隔能對(duì)你的數(shù)據(jù)進(jìn)行快照存儲(chǔ)。

·AOF持久化方式記錄每次對(duì)服務(wù)器寫的操作,當(dāng)服務(wù)器重啟的時(shí)候會(huì)重新執(zhí)行這些命令來恢復(fù)原始的數(shù)據(jù),AOF命令以redis協(xié)議追加保存每次寫的操作到文件末尾。Redis還能對(duì)AOF文件進(jìn)行后臺(tái)重寫,使得AOF文件的體積不至于過大。

·如果你只希望你的數(shù)據(jù)在服務(wù)器運(yùn)行的時(shí)候存在,你也可以不使用任何持久化方式。

·你也可以同時(shí)開啟兩種持久化方式, 在這種情況下, 當(dāng)redis重啟的時(shí)候會(huì)優(yōu)先載入AOF文件來恢復(fù)原始的數(shù)據(jù),因?yàn)樵谕ǔG闆r下AOF文件保存的數(shù)據(jù)集要比RDB文件保存的數(shù)據(jù)集要完整。

·最重要的事情是了解RDB和AOF持久化方式的不同,讓我們以RDB持久化方式開始


1.1.5.1.RDB的優(yōu)缺點(diǎn)
優(yōu)點(diǎn)
·RDB是一個(gè)非常緊湊的文件,它保存了某個(gè)時(shí)間點(diǎn)得數(shù)據(jù)集,非常適用于數(shù)據(jù)集的備份,比如你可以在每個(gè)小時(shí)報(bào)保存一下過去24小時(shí)內(nèi)的數(shù)據(jù),同時(shí)每天保存過去30天的數(shù)據(jù),這樣即使出了問題你也可以根據(jù)需求恢復(fù)到不同版本的數(shù)據(jù)集。
·RDB是一個(gè)緊湊的單一文件,很方便傳送到另一個(gè)遠(yuǎn)端數(shù)據(jù)中心或者亞馬遜的S3(可能加密),非常適用于災(zāi)難恢復(fù)。
·RDB在保存RDB文件時(shí)父進(jìn)程唯一需要做的就是fork出一個(gè)子進(jìn)程,接下來的工作全部由子進(jìn)程來做,父進(jìn)程不需要再做其他IO操作,所以RDB持久化方式可以最大化redis的性能。
·與AOF相比,在恢復(fù)大的數(shù)據(jù)集的時(shí)候,RDB方式會(huì)更快一些。

缺點(diǎn)
·如果你希望在redis意外停止工作(例如電源中斷)的情況下丟失的數(shù)據(jù)最少的話,那么RDB不適合你。雖然你可以配置不同的save時(shí)間點(diǎn)(例如每隔5分鐘并且對(duì)數(shù)據(jù)集有100個(gè)寫的操作),是Redis要完整的保存整個(gè)數(shù)據(jù)集是一個(gè)比較繁重的工作,你通常會(huì)每隔5分鐘或者更久做一次完整的保存,萬一在Redis意外宕機(jī),你可能會(huì)丟失幾分鐘的數(shù)據(jù)。

·RDB 需要經(jīng)常fork子進(jìn)程來保存數(shù)據(jù)集到硬盤上,當(dāng)數(shù)據(jù)集比較大的時(shí)候,fork的過程是非常耗時(shí)的,可能會(huì)導(dǎo)致Redis在一些毫秒級(jí)內(nèi)不能響應(yīng)客戶端的請(qǐng)求.如果數(shù)據(jù)集巨大并且CPU性能不是很好的情況下,這種情況會(huì)持續(xù)1秒,AOF也需要fork,但是你可以調(diào)節(jié)重寫日志文件的頻率來提高數(shù)據(jù)集的耐久度。


1.1.5.2.AOF 優(yōu)缺點(diǎn)

優(yōu)點(diǎn) -
使用AOF 會(huì)讓你的Redis更加耐久: 你可以使用不同的fsync策略:無fsync,每秒fsync,每次寫的時(shí)候fsync.使用默認(rèn)的每秒fsync策略,Redis的性能依然很好(fsync是由后臺(tái)線程進(jìn)行處理的,主線程會(huì)盡力處理客戶端請(qǐng)求),一旦出現(xiàn)故障,你最多丟失1秒的數(shù)據(jù)。

·AOF文件是一個(gè)只進(jìn)行追加的日志文件,所以不需要寫入seek,即使由于某些原因(磁盤空間已滿,寫的過程中宕機(jī)等等)未執(zhí)行完整的寫入命令,你也也可使用redis-check-aof工具修復(fù)這些問題。
·Redis 可以在 AOF 文件體積變得過大時(shí),自動(dòng)地在后臺(tái)對(duì) AOF 進(jìn)行重寫: 重寫后的新 AOF 文件包含了恢復(fù)當(dāng)前數(shù)據(jù)集所需的最小命令集合。 整個(gè)重寫操作是絕對(duì)安全的,因?yàn)?Redis 在創(chuàng)建新 AOF 文件的過程中,會(huì)繼續(xù)將命令追加到現(xiàn)有的 AOF 文件里面,即使重寫過程中發(fā)生停機(jī),現(xiàn)有的 AOF 文件也不會(huì)丟失。 而一旦新 AOF 文件創(chuàng)建完畢,Redis 就會(huì)從舊 AOF 文件切換到新 AOF 文件,并開始對(duì)新 AOF文件進(jìn)行追加操作。

·AOF 文件有序地保存了對(duì)數(shù)據(jù)庫執(zhí)行的所有寫入操作, 這些寫入操作以 Redis 協(xié)議的格式保存, 因此AOF 文件的內(nèi)容非常容易被人讀懂, 對(duì)文件進(jìn)行分析(parse)也很輕松。 導(dǎo)出(export) AOF 文件也非常簡(jiǎn)單: 舉個(gè)例子, 如果你不小心執(zhí)行了 FLUSHALL 命令, 但只要 AOF 文件未被重寫, 那么只要停止服務(wù)器, 移除 AOF 文件末尾的 FLUSHALL 命令, 并重啟R edis , 就可以將數(shù)據(jù)集恢復(fù)到FLUSHALL 執(zhí)行之前的狀態(tài)。

缺點(diǎn) -
·對(duì)于相同的數(shù)據(jù)集來說,AOF 文件的體積通常要大于 RDB 文件的體積。

根據(jù)所使用的 fsync 策略,AOF 的速度可能會(huì)慢于 RDB 。 在一般情況下, 每秒 fsync 的性能依然非常高, 而關(guān)閉 fsync 可以讓 AOF 的速度和 RDB 一樣快, 即使在高負(fù)荷之下也是如此。 不過在處理巨大的寫入載入時(shí),RDB 可以提供更有保證的最大延遲時(shí)間(latency)。


1.2.備份redis數(shù)據(jù)
在閱讀這個(gè)小節(jié)前, 請(qǐng)牢記下面這句話::確保你的數(shù)據(jù)由完整的備份. 磁盤故障, 節(jié)點(diǎn)失效, 諸如此類的問題都可能讓你的數(shù)據(jù)消失不見, 不進(jìn)行備份是非常危險(xiǎn)的。
Redis 對(duì)于數(shù)據(jù)備份是非常友好的, 因?yàn)槟憧梢栽诜?wù)器運(yùn)行的時(shí)候?qū)?RDB 文件進(jìn)行復(fù)制: RDB 文件一旦被創(chuàng)建, 就不會(huì)進(jìn)行任何修改。 當(dāng)服務(wù)器要?jiǎng)?chuàng)建一個(gè)新的 RDB 文件時(shí), 它先將文件的內(nèi)容保存在一個(gè)臨時(shí)文件里面, 當(dāng)臨時(shí)文件寫入完畢時(shí), 程序才使用 rename(2) 原子地用臨時(shí)文件替換原來的 RDB 文件。
這也就是說, 無論何時(shí), 復(fù)制 RDB 文件都是絕對(duì)安全的。

創(chuàng)建一個(gè)定期任務(wù)(cron job), 每小時(shí)將一個(gè) RDB 文件備份到一個(gè)文件夾, 并且每天將一個(gè) RDB 文件備份到另一個(gè)文件夾。
確保快照的備份都帶有相應(yīng)的日期和時(shí)間信息, 每次執(zhí)行定期任務(wù)腳本時(shí), 使用 find 命令來刪除過期的快照: 比如說, 你可以保留最近 48 小時(shí)內(nèi)的每小時(shí)快照, 還可以保留最近一兩個(gè)月的每日快照。
至少每天一次, 將 RDB 備份到你的數(shù)據(jù)中心之外, 或者至少是備份到你運(yùn)行 Redis 服務(wù)器的物理機(jī)器之外。


? #! /bin/bash
?
? PATH=/usr/local/bin:$PATH
? redis-cli SAVE
?
? date=$(date +"%Y%m%d")
? cp /var/lib/redis/6379/dump.rdb /data01/cache_backup/$date.rdb
? ? echo "done!"

1.3.容災(zāi)備份

Redis 的容災(zāi)備份基本上就是對(duì)數(shù)據(jù)進(jìn)行備份, 并將這些備份傳送到多個(gè)不同的外部數(shù)據(jù)中心。容災(zāi)備份可以在Redis 運(yùn)行并產(chǎn)生快照的主數(shù)據(jù)中心發(fā)生嚴(yán)重的問題時(shí), 仍然讓數(shù)據(jù)處于安全狀態(tài)。

因?yàn)楹芏?Redis 用戶都是創(chuàng)業(yè)者, 他們沒有大把大把的錢可以浪費(fèi), 所以下面介紹的都是一些實(shí)用又便宜的容災(zāi)備份方法:
·Amazon S3 ,以及其他類似 S3 的服務(wù),是一個(gè)構(gòu)建災(zāi)難備份系統(tǒng)的好地方。 最簡(jiǎn)單的方法就是將你的每小時(shí)或者每日 RDB 備份加密并傳送到 S3 。 對(duì)數(shù)據(jù)的加密可以通過 gpg -c 命令來完成(對(duì)稱加密模式)。 記得把你的密碼放到幾個(gè)不同的、安全的地方去(比如你可以把密碼復(fù)制給你組織里最重要的人物)。 同時(shí)使用多個(gè)儲(chǔ)存服務(wù)來保存數(shù)據(jù)文件,可以提升數(shù)據(jù)的安全性。

傳送快照可以使用 SCP 來完成(SSH 的組件)。 以下是簡(jiǎn)單并且安全的傳送方法: 買一個(gè)離你的數(shù)據(jù)中心非常遠(yuǎn)的 VPS , 裝上 SSH , 創(chuàng)建一個(gè)無口令的 SSH 客戶端 key , 并將這個(gè) key 添加到 VPS 的authorized_keys 文件中, 這樣就可以向這個(gè) VPS 傳送快照備份文件了。 為了達(dá)到最好的數(shù)據(jù)安全性,至少要從兩個(gè)不同的提供商那里各購買一個(gè) VPS 來進(jìn)行數(shù)據(jù)容災(zāi)備份。

·需要注意的是, 這類容災(zāi)系統(tǒng)如果沒有小心地進(jìn)行處理的話, 是很容易失效的。最低限度下, 你應(yīng)該在文件傳送完畢之后, 檢查所傳送備份文件的體積和原始快照文件的體積是否相同。 如果你使用的是VPS , 那么還可以通過比對(duì)文件的 SHA1 校驗(yàn)和來確認(rèn)文件是否傳送完整。

另外, 你還需要一個(gè)獨(dú)立的警報(bào)系統(tǒng), 讓它在負(fù)責(zé)傳送備份文件的傳送器(transfer)失靈時(shí)通知你。

猜你喜歡

java高并發(fā):如何解決秒殺的高并發(fā)?


分享到:
在線咨詢 我要報(bào)名
和我們?cè)诰€交談!