突破數(shù)據(jù)庫備份恢復(fù)瓶頸:華瑞指數(shù)云“無損快照”技術(shù)賦能企業(yè)數(shù)據(jù)庫實現(xiàn)秒級數(shù)據(jù)保護(hù)

引言

在快節(jié)奏的數(shù)字化時代,數(shù)據(jù)已成為企業(yè)的生命線。各行各業(yè)都在以前所未有的速度產(chǎn)生和積累數(shù)據(jù),而如何高效、可靠地保護(hù)和恢復(fù)這些數(shù)據(jù),成為了企業(yè)持續(xù)運營和創(chuàng)新發(fā)展的關(guān)鍵挑戰(zhàn)。

在近日舉辦的 IF Club 技術(shù)研討會上,獨立技術(shù)顧問、IFClub聯(lián)合發(fā)起人蕭少聰老師帶來的主題分享《復(fù)刻云數(shù)據(jù)庫的高端特性:秒級克隆、備份與恢復(fù)》,其中介紹了基于華瑞指數(shù)云高性能存儲產(chǎn)品WDS的ROW無損快照方案實現(xiàn),高性能分布式存儲結(jié)合數(shù)據(jù)庫場景的秒級快照克隆方案。分享之后,數(shù)據(jù)庫備份恢復(fù)技術(shù)成為了討論的焦點。與會專家深入剖析了傳統(tǒng)備份恢復(fù)方案的痛點,并重點探討了以“快照”技術(shù)為代表的新一代數(shù)據(jù)保護(hù)方案。本文將以研討會內(nèi)容為基礎(chǔ),結(jié)合對主流云數(shù)據(jù)庫服務(wù)快照技術(shù)原理的分析,為讀者呈現(xiàn)一場關(guān)于企業(yè)級數(shù)據(jù)保護(hù)的深度技術(shù)解析。

數(shù)據(jù)庫備份恢復(fù):一場與時間和資源的博弈

傳統(tǒng)數(shù)據(jù)庫備份恢復(fù)面臨著嚴(yán)峻的挑戰(zhàn):

數(shù)據(jù)復(fù)制之困:傳統(tǒng)備份方法通常需要對整個數(shù)據(jù)庫進(jìn)行完整拷貝,這不僅耗時漫長,而且會占用大量的存儲空間,甚至可能導(dǎo)致存儲成本翻倍. 更糟糕的是,備份過程會嚴(yán)重消耗源數(shù)據(jù)庫的 I/O 性能,影響業(yè)務(wù)的正常運行。

恢復(fù)時間之殤:恢復(fù)數(shù)據(jù)庫同樣是一項耗時的任務(wù)。雖然在理想情況下,恢復(fù)操作本身可能只需幾秒鐘,但實際場景中,數(shù)據(jù)傳輸、日志重放等環(huán)節(jié)都會增加恢復(fù)時間,使得企業(yè)面臨更長的業(yè)務(wù)中斷風(fēng)險。

資源消耗之痛:傳統(tǒng)備份方式對存儲空間、計算資源和網(wǎng)絡(luò)帶寬都有著巨大的需求,這無疑給企業(yè)帶來了沉重的運營成本和資源負(fù)擔(dān)。

技術(shù)深潛:從COW到ROW,快照技術(shù)的進(jìn)化論

“快照”技術(shù)作為一種先進(jìn)的數(shù)據(jù)備份與恢復(fù)手段,通過創(chuàng)建數(shù)據(jù)在特定時間點的邏輯副本,實現(xiàn)了快速備份和恢復(fù),“快照”技術(shù)作為一種先進(jìn)的數(shù)據(jù)備份與恢復(fù)手段,通過創(chuàng)建數(shù)據(jù)在特定時間點的邏輯副本,實現(xiàn)了快速備份和恢復(fù)。

1.快照的本質(zhì):

    快照,顧名思義,就是對數(shù)據(jù)在某一時刻的狀態(tài)進(jìn)行“拍照”,生成一個邏輯副本. 這個副本并非完整的數(shù)據(jù)拷貝,而是指向原始數(shù)據(jù)或其變化部分的指針。  

2.  快照的優(yōu)勢:

瞬時生成:由于無需進(jìn)行物理數(shù)據(jù)拷貝,快照的創(chuàng)建速度極快,通常只需幾秒鐘。

節(jié)省空間:快照只記錄數(shù)據(jù)的變化,因此占用空間遠(yuǎn)小于全量備份。 研討會上,有專家舉例指出,對于一個 500GB+ 的企業(yè)數(shù)據(jù)庫,使用傳統(tǒng)備份方式可能需要額外500GB+ 甚至更多的存儲空間來存儲備份數(shù)據(jù),而采用快照機制,首次快照可能只占用幾十 GB 的空間,后續(xù)的增量快照占用空間更少。

降低 I/O:快照的創(chuàng)建和恢復(fù)過程對源數(shù)據(jù)庫的 I/O 影響較小。

3.  快照的關(guān)鍵技術(shù):

    實現(xiàn)快照的關(guān)鍵在于“寫時復(fù)制”(Copy-on-Write,COW)和“寫時重定向”(Redirect-on-Write,ROW)這兩種技術(shù)。

COW 快照: COW 快照的核心思想是,在修改數(shù)據(jù)之前,先將原始數(shù)據(jù)復(fù)制到快照區(qū)域,然后再進(jìn)行修改。

突破數(shù)據(jù)庫備份恢復(fù)瓶頸:華瑞指數(shù)云“無損快照”技術(shù)賦能企業(yè)數(shù)據(jù)庫實現(xiàn)秒級數(shù)據(jù)保護(hù)

優(yōu)點:實現(xiàn)簡單

缺點:寫入性能會受到較大影響,因為每次寫入都需要先復(fù)制數(shù)據(jù)

ROW 快照: ROW 快照則是在修改數(shù)據(jù)時,將修改操作重定向到新的存儲區(qū)域,保持原始數(shù)據(jù)不變。

突破數(shù)據(jù)庫備份恢復(fù)瓶頸:華瑞指數(shù)云“無損快照”技術(shù)賦能企業(yè)數(shù)據(jù)庫實現(xiàn)秒級數(shù)據(jù)保護(hù)

優(yōu)點:寫入性能更高,因為無需復(fù)制原始數(shù)據(jù)

缺點:讀取數(shù)據(jù)時可能需要查詢多個指針,導(dǎo)致讀取性能略有下降

“不可能完成的任務(wù)” —— 數(shù)據(jù)庫秒級備份恢復(fù)

當(dāng)前主流的開源數(shù)據(jù)庫產(chǎn)品以PostgreSQL還是MySQL為主,大多數(shù)是私有化部署,如果需要實現(xiàn)數(shù)據(jù)庫基于快照的備份恢復(fù)方案,大多數(shù)場景需要對接第三方存儲或者本地盤來實現(xiàn)。

本地盤(HDD或者SSD)方案一般會選用操作系統(tǒng)自帶的LVM來實現(xiàn)快照,而對接第三方存儲多數(shù)會架構(gòu)在ceph等分布式存儲的基礎(chǔ)上,使用ceph的快照。而無論是LVM還是Ceph,都是使用COW實現(xiàn)的快照,帶來的快照和克隆都是有大幅的性能下降風(fēng)險。別說秒級,就算小時級都達(dá)不到。

所以當(dāng)前私有化部署的數(shù)據(jù)庫大多數(shù)沒有基于快照克隆的太好的存儲解決方案,大多數(shù)第三方存儲方案由于快照實現(xiàn)的方案的各種局限性,也不能完全滿足數(shù)據(jù)庫秒級數(shù)據(jù)備份的需求,至此實現(xiàn)數(shù)據(jù)庫“秒級備份恢復(fù)”成為了一個“不可能完成的任務(wù)”。

主流云數(shù)據(jù)庫的技術(shù)實踐 —— “秒級備份恢復(fù)”

在公有云產(chǎn)品中數(shù)據(jù)庫的功能實現(xiàn)相較于私有部署場景具備更加完整的能力實現(xiàn),很多公有云數(shù)據(jù)庫都已經(jīng)具備或者接近“秒級備份恢復(fù)”的數(shù)據(jù)庫數(shù)據(jù)保護(hù)能力,我們基于行業(yè)的一些主流資料對于幾個主流的頭部云數(shù)據(jù)庫產(chǎn)品的數(shù)據(jù)備份恢復(fù)能力做了分析:

AWS:RDS 和 Aurora(基于COW優(yōu)化接近秒級備份恢復(fù)體驗)

RDS:AWS RDS 主要依賴于 EBS實現(xiàn)的快照來實現(xiàn)備份和恢復(fù)。

克?。篈WS RDS 的實例克隆主要通過“從快照還原”(Restore Snapshot)操作實現(xiàn),本質(zhì)上是數(shù)據(jù)的完全復(fù)制。

快照:EBS 快照是增量式的,僅存儲自上一個快照以來發(fā)生變化的數(shù)據(jù)塊。

PITR:RDS 的 PITR 結(jié)合了快照和事務(wù)日志,可以恢復(fù)到指定的某個時間點。

Aurora:AWS Aurora 采用了一種計算和存儲分離的架構(gòu),并在此基礎(chǔ)上實現(xiàn)了更高效的快照和克隆。  

克?。篈urora 的克隆利用了“寫時復(fù)制”(Copy-on-Write,CoW)機制,只需創(chuàng)建指向共享存儲的元數(shù)據(jù)指針,無需拷貝數(shù)據(jù),因此速度極快。

快照:Aurora 快照實際上是在這個連續(xù)備份流中的元數(shù)據(jù)指針或標(biāo)記,是一個 O(1) 操作。

 PITR:Aurora 的 PITR 基于連續(xù)備份流,可以實現(xiàn)秒級恢復(fù)。

阿里云:RDS 和 PolarDB(基于高性能快照實現(xiàn)了秒級備份恢復(fù))

RDS:阿里云 RDS 與 AWS RDS 類似,也主要依賴于云盤的快照功能來實現(xiàn)備份和恢復(fù)。

克?。喊⒗镌?RDS 的克隆是通過將源實例的數(shù)據(jù)恢復(fù)到一個新實例來實現(xiàn)的,本質(zhì)上是一個還原操作,創(chuàng)建數(shù)據(jù)的完整副本。

快照:阿里云 RDS 的快照也是增量式的。

PITR:阿里云 RDS 的 PITR 同樣結(jié)合了快照和日志備份。

PolarDB:阿里云 PolarDB 的架構(gòu)與 AWS Aurora 類似,也采用了計算存儲分離的設(shè)計,并實現(xiàn)了快速克隆和恢復(fù)。

克?。篜olarDB 利用其底層存儲的快照技術(shù)來實現(xiàn)快速克隆。

通過對比分析 AWS 和阿里云兩家基于自己不同的存儲快照能力實現(xiàn)的備份恢復(fù)效果,我們可以看到,主流云數(shù)據(jù)庫服務(wù)在利用快照技術(shù)提升數(shù)據(jù)備份恢復(fù)的效率和性能的方向已經(jīng)取得了一定的成績。

但是如何提升企業(yè)私有化部署場景的數(shù)據(jù)庫數(shù)據(jù)備份恢復(fù)能力呢?

數(shù)據(jù)庫秒級備份恢復(fù)的破局者:華瑞指數(shù)云的“ROW無損快照克隆”

在前文COW與ROW的實現(xiàn)原理中,可以看到,雖然 ROW 快照在寫入性能方面優(yōu)于 COW 快照,但通用的 ROW 實現(xiàn)方案通常會犧牲一定的讀取性能。而一些前沿的分布式數(shù)據(jù)庫廠商(比如:華瑞指數(shù)云),已經(jīng)實現(xiàn)了更先進(jìn)的“無損 ROW 快照”技術(shù),即在保證寫入性能的同時,也實現(xiàn)了讀取性能的零損耗。在私有化部署場景讓客戶能夠擁有近乎完美的快照體驗。

突破數(shù)據(jù)庫備份恢復(fù)瓶頸:華瑞指數(shù)云“無損快照”技術(shù)賦能企業(yè)數(shù)據(jù)庫實現(xiàn)秒級數(shù)據(jù)保護(hù)

當(dāng)前華瑞指數(shù)云 WDS 基于自己的快照能力真正實現(xiàn)了“無損 ROW 快照克隆”技術(shù),克服了通用 ROW 快照的局限性,實現(xiàn)了真正的秒級快照和讀寫性能零損耗 。  

讀寫零損耗: 傳統(tǒng)快照技術(shù)可能會對數(shù)據(jù)庫的讀寫性能產(chǎn)生一定的影響,而華瑞指數(shù)云WDS的“ROW無損快照”技術(shù),通過針對讀場景的針對性優(yōu)化,解決了ROW快照讀流程實現(xiàn)中的缺陷,真正能夠確保在快照創(chuàng)建和使用過程中,數(shù)據(jù)庫的讀寫性能始終如一,不會出現(xiàn)任何下降。

秒級快照: 通過快照實現(xiàn)流程的精細(xì)化實現(xiàn),華瑞指數(shù)云WDS實現(xiàn)的ROW快照真正支持以秒級的粒度創(chuàng)建快照,這意味著可以更加頻繁地備份數(shù)據(jù),實現(xiàn)更精細(xì)的數(shù)據(jù)恢復(fù),將數(shù)據(jù)丟失的風(fēng)險降到最低。甚至單卷的快照個數(shù)可以達(dá)到數(shù)萬個級別。

靈活的備份策略: 由于華瑞指數(shù)云ROW快照技術(shù)的出色實現(xiàn),WDS高性能塊存儲產(chǎn)品也可以通過快照實現(xiàn)并支持多種數(shù)據(jù)備份策略,用戶可以根據(jù)自身的業(yè)務(wù)需求,靈活地設(shè)置備份頻率、保留時間和備份方式,實現(xiàn)定制化的數(shù)據(jù)保護(hù)。

秒級克?。夯凇盁o損快照”技術(shù),華瑞指數(shù)云WDS實現(xiàn)了數(shù)據(jù)庫的秒級克隆能力. 傳統(tǒng)數(shù)據(jù)庫克隆為了解決克隆卷讀寫性能折損的問題,需要進(jìn)行大量的數(shù)據(jù)拷貝來用Flatten功能與原快照解耦,耗時漫長,而華瑞指數(shù)云WDS只需秒級即可完成一個數(shù)據(jù)庫的克隆,由于讀寫性能真正做到了無損,無需再使用Flatten克隆來做大量的全量拷貝,極大地提升了數(shù)據(jù)庫的敏捷性。  

通過以上的“無損 ROW 快照克隆”技術(shù),可以真正幫助私有化部署場景的數(shù)據(jù)庫對接華瑞指數(shù)云WDS存儲實現(xiàn)“秒級備份恢復(fù)”能力,可以讓企業(yè)用戶在私有化部署場景真正能夠體驗公有云數(shù)據(jù)庫一樣的流暢的備份恢復(fù)效果。

實踐案例:PostgreSQL 數(shù)據(jù)庫的備份與恢復(fù)

IF Club 技術(shù)研討會上,蕭少聰老師帶來的主題分享《復(fù)刻云數(shù)據(jù)庫的高端特性:秒級克隆、備份與恢復(fù)》PPT 中還提供了 PostgreSQL 數(shù)據(jù)庫在使用 Ceph 和華瑞指數(shù)云 WDS 進(jìn)行備份和恢復(fù)的詳細(xì)操作步驟:  

備份過程: 通過 pg_backup_start 和 pg_backup_stop 命令配合存儲系統(tǒng)的快照功能,實現(xiàn)數(shù)據(jù)庫的備份 。

恢復(fù)過程: 通過克隆快照并掛載到目標(biāo)服務(wù)器,實現(xiàn)數(shù)據(jù)庫的快速恢復(fù) 。

性能恢復(fù): Ceph 需要進(jìn)行 flatten 操作才能恢復(fù)性能,而華瑞指數(shù)云 WDS 無此步驟,恢復(fù)速度更快 。

秒級克隆:基于快照創(chuàng)建完整數(shù)據(jù)庫副本,無需全量拷貝。

PITR精準(zhǔn)恢復(fù):結(jié)合WAL日志,實現(xiàn)任意時間點數(shù)據(jù)回溯,誤差<1秒。

# 華瑞WDS克隆操作示例(3步完成)

cli_ts snap create –snap_name prod_snap –vol_name pg_main  # 創(chuàng)建快照

cli_ts snap clone –vol_name pg_clone –snap_name prod_snap  # 克隆快照

cli_ts vol attach –vol_name pg_clone –target nqn.2024-06.wds  # 掛載克隆體

詳細(xì)流程可以參見《復(fù)刻云數(shù)據(jù)庫的高端特性:秒級克隆、備份與恢復(fù)》。(下載鏈接:https://ifclub.com.cn/details/1921836782856605698?t=1747099511716)

華瑞指數(shù)云WDS:定義新一代企業(yè)級數(shù)據(jù)庫存儲

華瑞指數(shù)云所有的產(chǎn)品能力無論是ROW無損快照,還是極致的低時延都得益于華瑞指數(shù)云先進(jìn)的存儲架構(gòu)能力,為數(shù)據(jù)庫應(yīng)用帶來了前所未有的靈活性和性能提升。在數(shù)字化轉(zhuǎn)型的浪潮中,企業(yè)對于數(shù)據(jù)庫的依賴日益加深。數(shù)據(jù)庫使用的傳統(tǒng)存儲架構(gòu)的種種局限性,如擴展性瓶頸、性能瓶頸、資源浪費等,已經(jīng)成為制約企業(yè)發(fā)展的桎梏。華瑞指數(shù)云WDS,作為一款創(chuàng)新的分布式存儲解決方案,旨在打破這些束縛,為企業(yè)級數(shù)據(jù)庫應(yīng)用帶來前所未有的自由度和效率提升。

高性能、無限擴展的分布式存儲:數(shù)據(jù)庫的“超強引擎”

華瑞指數(shù)云WDS不僅在快照和克隆方面表現(xiàn)出色,更具備卓越的存儲性能和擴展能力,為數(shù)據(jù)庫應(yīng)用提供強大的支撐。

極致性能: 華瑞指數(shù)云WDS的性能經(jīng)過權(quán)威機構(gòu) SPC-1 的驗證,IOPS 達(dá)到數(shù)千萬,延遲低至微秒級別,超越了眾多高端全閃存陣列,為數(shù)據(jù)庫應(yīng)用提供極致的性能體驗。

線性擴展: 華瑞指數(shù)云WDS的分布式架構(gòu)支持無限的線性擴展,可以輕松應(yīng)對數(shù)據(jù)庫數(shù)據(jù)量的增長和業(yè)務(wù)規(guī)模的擴大,滿足業(yè)務(wù)持續(xù)發(fā)展的需求。

全信創(chuàng)、純軟件定義: 華瑞指數(shù)云WDS實現(xiàn)了全棧的信創(chuàng)支持,滿足了對信息安全有較高要求的行業(yè)和場景的需求。同時,純軟件定義的架構(gòu),可以靈活地部署在各種硬件平臺之上,降低用戶的采購成本和運維復(fù)雜度。

數(shù)據(jù)庫與分布式存儲的深度融合:釋放數(shù)據(jù)潛能,定義新的能力邊界

華瑞指數(shù)云WDS與數(shù)據(jù)庫的結(jié)合,打破了傳統(tǒng)架構(gòu)的束縛,釋放了數(shù)據(jù)的巨大潛能,并能夠?qū)崿F(xiàn)一些過去只能在公有云數(shù)據(jù)庫產(chǎn)品上才能實現(xiàn)的高級能力,在私有云環(huán)境中為數(shù)據(jù)庫賦予了新的生命力。

高級能力普惠化: 華瑞指數(shù)云WDS將公有云上的數(shù)據(jù)庫高級能力,如彈性伸縮、多活容災(zāi)等,帶到私有云環(huán)境,讓更多的企業(yè)能夠享受到這些技術(shù)紅利,加速數(shù)字化轉(zhuǎn)型。

定義新的能力邊界: 通過分布式存儲帶來的高性能、無限擴展能力,數(shù)據(jù)庫可以處理更大規(guī)模的數(shù)據(jù),支撐更復(fù)雜的業(yè)務(wù)場景,突破傳統(tǒng)數(shù)據(jù)庫的能力邊界,為企業(yè)帶來更大的創(chuàng)新空間。

結(jié)論

通過華瑞指數(shù)云WDS以其“無損快照克隆”技術(shù),真正可以實現(xiàn)數(shù)據(jù)庫的”秒級備份恢復(fù)“的能力,讓客戶在私有化部署場景一樣可以體驗到云數(shù)據(jù)庫的備份恢復(fù)能力。結(jié)合華瑞指數(shù)云的各種高性能存儲能力,為企業(yè)級數(shù)據(jù)庫應(yīng)用帶來了革命性的變革。它不僅能夠滿足客戶對高性能、高擴展性、高安全性的需求,更能夠賦能數(shù)據(jù)庫應(yīng)用,實現(xiàn)更多高級功能,助力企業(yè)在數(shù)字經(jīng)濟時代獲得更大的競爭優(yōu)勢。

另外感謝IF Club 技術(shù)研討會為我們提供了一個深入了解數(shù)據(jù)庫備份恢復(fù)技術(shù)的平臺。通過對“快照”技術(shù)的剖析,以及對主流云數(shù)據(jù)庫服務(wù)實踐的探討,我們看到了數(shù)據(jù)保護(hù)領(lǐng)域正在發(fā)生的深刻變革。

本文轉(zhuǎn)載自:,不代表科技訊之立場。原文鏈接:http://news.cnmtpt.com/?Sid=12000709_5039W542206289

陳晨陳晨管理團隊

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論