新聞中心
大家好,我是樓仔!

為永仁等地區(qū)用戶提供了全套網(wǎng)頁(yè)設(shè)計(jì)制作服務(wù),及永仁網(wǎng)站建設(shè)行業(yè)解決方案。主營(yíng)業(yè)務(wù)為網(wǎng)站建設(shè)、做網(wǎng)站、永仁網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠(chéng)的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會(huì)得到認(rèn)可,從而選擇與我們長(zhǎng)期合作。這樣,我們也可以走得更遠(yuǎn)!
MySQL 主從一直是面試???,里面的知識(shí)點(diǎn)雖然基礎(chǔ),但是能回答全的同學(xué)不多。
比如我之前面試小米,就被問到過主從復(fù)制的原理,以及主從延遲的解決方案,你之前面試,有遇到過哪些 MySQL 主從的問題呢?
1. MySQL 主從
1.1 什么是 MySQL 主從 ?
所謂 MySQL 主從,就是建立兩個(gè)完全一樣的數(shù)據(jù)庫(kù),一個(gè)是主庫(kù),一個(gè)是從庫(kù),主庫(kù)對(duì)外提供讀寫的操作,從庫(kù)對(duì)外提供讀的操作。
1.2 為什么使用 MySQL 主從 ?
對(duì)于數(shù)據(jù)庫(kù)單機(jī)部署,在 4 核 8G 的機(jī)器上運(yùn)行 MySQL 5.7 時(shí),大概可以支撐 500 的 TPS 和
10000 的 QPS,當(dāng)遇到一些活動(dòng)時(shí),查詢流量驟然,就需要進(jìn)行主從分離。
大部分系統(tǒng)的訪問模型是讀多寫少,讀寫請(qǐng)求量的差距可能達(dá)到幾個(gè)數(shù)量級(jí),所以我們可以通過一主多從的方式,主庫(kù)只負(fù)責(zé)寫入和部分核心邏輯的查詢,多個(gè)從庫(kù)只負(fù)責(zé)查詢,提升查詢性能,降低主庫(kù)壓力。
當(dāng)主庫(kù)宕機(jī)時(shí),從庫(kù)可以切成主庫(kù),保證服務(wù)的高可用,然后主庫(kù)也可以做數(shù)據(jù)的容災(zāi)備份,整體場(chǎng)景總結(jié)如下:
- 讀寫分離:從庫(kù)提供查詢,減少主庫(kù)壓力,提升性能;
- 高可用:故障時(shí)可切換從庫(kù),保證服務(wù)高可用;
- 數(shù)據(jù)備份:數(shù)據(jù)備份到從庫(kù),防止服務(wù)器宕機(jī)導(dǎo)致數(shù)據(jù)丟失。
2. 主從復(fù)制
2.1 主從復(fù)制原理
MySQL 的主從復(fù)制是依賴于 binlog,也就是記錄 MySQL 上的所有變化并以二進(jìn)制形式保存在磁盤上二進(jìn)制日志文件。
主從復(fù)制就是將 binlog 中的數(shù)據(jù)從主庫(kù)傳輸?shù)綇膸?kù)上,一般這個(gè)過程是異步的,即主庫(kù)上的操作不會(huì)等待 binlog 同步地完成。
詳細(xì)流程如下:
- 主庫(kù)寫 binlog:主庫(kù)的更新 SQL(update、insert、delete) 被寫到 binlog;
- 主庫(kù)發(fā)送 binlog:主庫(kù)創(chuàng)建一個(gè) log dump 線程來(lái)發(fā)送 binlog 給從庫(kù);
- 從庫(kù)寫 relay log:從庫(kù)在連接到主節(jié)點(diǎn)時(shí)會(huì)創(chuàng)建一個(gè) IO 線程,以請(qǐng)求主庫(kù)更新的 binlog,并且把接收到的 binlog 信息寫入一個(gè)叫做
relay log 的日志文件; - 從庫(kù)回放:從庫(kù)還會(huì)創(chuàng)建一個(gè) SQL 線程讀取 relay log 中的內(nèi)容,并且在從庫(kù)中做回放,最終實(shí)現(xiàn)主從的一致性。
2.2 如何保證主從一致
當(dāng)主庫(kù)和從庫(kù)數(shù)據(jù)同步時(shí),突然中斷怎么辦?因?yàn)橹鲙?kù)與從庫(kù)之間維持了一個(gè)長(zhǎng)鏈接,主庫(kù)內(nèi)部有一個(gè)線程,專門服務(wù)于從庫(kù)的這個(gè)長(zhǎng)鏈接。
對(duì)于下面的情況,假如主庫(kù)執(zhí)行如下 SQL,其中 a 和 create_time 都是索引:
delete from t where a > '666' and create_time<'2022-03-01' limit 1;
我們知道,數(shù)據(jù)選擇了 a 索引和選擇 create_time 索引,最后 limit 1 出來(lái)的數(shù)據(jù)一般是不一樣的。
所以就會(huì)存在這種情況:在 binlog = statement 格式時(shí),主庫(kù)在執(zhí)行這條 SQL 時(shí),使用的是索引 a,而從庫(kù)在執(zhí)行這條 SQL
時(shí),使用了索引 create_time,最后主從數(shù)據(jù)不一致了。
那么我們?cè)撊绾谓鉀Q呢?
可以把 binlog 格式修改為 row,row 格式的 binlog 日志記錄的不是 SQL 原文,而是兩個(gè) event:Table_map 和
Delete_rows。
Table_map event 說明要操作的表,Delete_rows event用于定義要?jiǎng)h除的行為,記錄刪除的具體行數(shù)。row 格式的 binlog
記錄的就是要?jiǎng)h除的主鍵 ID 信息,因此不會(huì)出現(xiàn)主從不一致的問題。
但是如果 SQL 刪除 10 萬(wàn)行數(shù)據(jù),使用 row 格式就會(huì)很占空間,10 萬(wàn)條數(shù)據(jù)都在 binlog 里面,寫 binlog 的時(shí)候也很耗 IO。但是
statement 格式的 binlog 可能會(huì)導(dǎo)致數(shù)據(jù)不一致。
設(shè)計(jì) MySQL 的大叔想了一個(gè)折中的方案,mixed 格式的 binlog,其實(shí)就是 row 和 statement 格式混合使用,當(dāng) MySQL
判斷可能數(shù)據(jù)不一致時(shí),就用 row 格式,否則使用就用 statement 格式。
3. 主從延遲
有時(shí)候我們遇到從數(shù)據(jù)庫(kù)中獲取不到信息的詭異問題時(shí),會(huì)糾結(jié)于代碼中是否有一些邏輯會(huì)把之前寫入的內(nèi)容刪除,但是你又會(huì)發(fā)現(xiàn),過了一段時(shí)間再去查詢時(shí)又可以讀到數(shù)據(jù)了,這基本上就是主從延遲在作怪。
主從延遲,其實(shí)就是“從庫(kù)回放” 完成的時(shí)間,與 “主庫(kù)寫 binlog” 完成時(shí)間的差值,會(huì)導(dǎo)致從庫(kù)查詢的數(shù)據(jù),和主庫(kù)的不一致。
3.1 主從延遲原理
談到 MySQL 數(shù)據(jù)庫(kù)主從同步延遲原理,得從 MySQL 的主從復(fù)制原理說起:
- MySQL 的主從復(fù)制都是單線程的操作,主庫(kù)對(duì)所有 DDL 和 DML 產(chǎn)生 binlog,binlog 是順序?qū)懀孕屎芨?
- Slave 的 Slave_IO_Running 線程會(huì)到主庫(kù)取日志,放入 relay log,效率會(huì)比較高;
- Slave 的 Slave_SQL_Running 線程將主庫(kù)的 DDL 和 DML 操作都在 Slave 實(shí)施,DML 和 DDL 的 IO 操作是隨機(jī)的,不是順序的,因此成本會(huì)很高,還可能是 Slave 上的其他查詢產(chǎn)生 lock 爭(zhēng)用,由于 Slave_SQL_Running 也是單線程的,所以一個(gè) DDL 卡主了,需要執(zhí)行 10 分鐘,那么所有之后的 DDL 會(huì)等待這個(gè) DDL 執(zhí)行完才會(huì)繼續(xù)執(zhí)行,這就導(dǎo)致了延時(shí)。
總結(jié)一下主從延遲的主要原因:主從延遲主要是出現(xiàn)在 “relay log 回放” 這一步,當(dāng)主庫(kù)的 TPS 并發(fā)較高,產(chǎn)生的 DDL 數(shù)量超過從庫(kù)一個(gè)
SQL 線程所能承受的范圍,那么延時(shí)就產(chǎn)生了,當(dāng)然還有就是可能與從庫(kù)的大型 query 語(yǔ)句產(chǎn)生了鎖等待。
3.2 主從延遲情況
- 從庫(kù)機(jī)器性能:從庫(kù)機(jī)器比主庫(kù)的機(jī)器性能差,只需選擇主從庫(kù)一樣規(guī)格的機(jī)器就好。
- 從庫(kù)壓力大:可以搞了一主多從的架構(gòu),還可以把 binlog 接入到 Hadoop 這類系統(tǒng),讓它們提供查詢的能力。
- 從庫(kù)過多:要避免復(fù)制的從節(jié)點(diǎn)數(shù)量過多,從庫(kù)數(shù)據(jù)一般以3-5個(gè)為宜。
- 大事務(wù):如果一個(gè)事務(wù)執(zhí)行就要 10 分鐘,那么主庫(kù)執(zhí)行完后,給到從庫(kù)執(zhí)行,最后這個(gè)事務(wù)可能就會(huì)導(dǎo)致從庫(kù)延遲 10 分鐘啦。日常開發(fā)中,不要一次性
delete 太多 SQL,需要分批進(jìn)行,另外大表的 DDL 語(yǔ)句,也會(huì)導(dǎo)致大事務(wù)。 - 網(wǎng)絡(luò)延遲:優(yōu)化網(wǎng)絡(luò),比如帶寬 20M 升級(jí)到 100M。
- MySQL 版本低:低版本的 MySQL 只支持單線程復(fù)制,如果主庫(kù)并發(fā)高,來(lái)不及傳送到從庫(kù),就會(huì)導(dǎo)致延遲,可以換用更高版本的
MySQL,支持多線程復(fù)制。
3.3 主從延遲解決方案
我們一般會(huì)把從庫(kù)落后的時(shí)間作為一個(gè)重點(diǎn)的數(shù)據(jù)庫(kù)指標(biāo)做監(jiān)控和報(bào)警,正常的時(shí)間是在毫秒級(jí)別,一旦落后的時(shí)間達(dá)到了秒級(jí)別就需要告警了。
解決該問題的方法,除了縮短主從延遲的時(shí)間,還有一些其它的方法,基本原理都是盡量不查詢從庫(kù),具體解決方案如下:
- 使用緩存:我們?cè)谕綄憯?shù)據(jù)庫(kù)的同時(shí),也把數(shù)據(jù)寫到緩存,查詢數(shù)據(jù)時(shí),會(huì)先查詢緩存,不過這種情況會(huì)帶來(lái) MySQL 和 Redis 數(shù)據(jù)一致性問題。
- 查詢主庫(kù):直接查詢主庫(kù),這種情況會(huì)給主庫(kù)太大壓力,不建議這種方式。
- 數(shù)據(jù)冗余:對(duì)于一些異步處理的場(chǎng)景,如果只扔數(shù)據(jù) ID,消費(fèi)數(shù)據(jù)時(shí),需要查詢從庫(kù),我們可以把數(shù)據(jù)全部都扔給消息隊(duì)列,這樣消費(fèi)者就無(wú)需再查詢從庫(kù)。(這種情況應(yīng)該不太能出現(xiàn),數(shù)據(jù)轉(zhuǎn)了一圈,MySQL 主從還沒有同步好,直接去撕 DBA 吧)
在實(shí)際應(yīng)用場(chǎng)景中,對(duì)于一些非常核心的場(chǎng)景,比如庫(kù)存,支付訂單等,需要直接查詢從庫(kù),其它非核心場(chǎng)景,就不要去查主庫(kù)了。
4. 主從切換
4.1 一主一從
兩臺(tái)機(jī)器 A 和 B,A 為主庫(kù),負(fù)責(zé)讀寫,B 為從庫(kù),負(fù)責(zé)讀數(shù)據(jù)。
如果 A 庫(kù)發(fā)生故障,B 庫(kù)成為主庫(kù)負(fù)責(zé)讀寫,修復(fù)故障后,A 成為從庫(kù),主庫(kù) B 同步數(shù)據(jù)到從庫(kù) A。
優(yōu)點(diǎn):從庫(kù)支持讀,分擔(dān)了主庫(kù)的壓力,提升了并發(fā)度,且一個(gè)機(jī)器故障了可以自動(dòng)切換,操作比較簡(jiǎn)單,公司從庫(kù)還可以充當(dāng)數(shù)據(jù)備份的角色;
缺點(diǎn):一臺(tái)從庫(kù),并發(fā)支持還是不夠,并且一共兩臺(tái)機(jī)器,還是存在同時(shí)故障的機(jī)率,不夠高可用。
對(duì)于一主一從的模式,一般小公司會(huì)這么用,不過該模式下,主從分離的意義其實(shí)并不大,因?yàn)樾」镜牧髁坎桓?,更多是為了?shù)據(jù)庫(kù)的可用性,以及數(shù)據(jù)備份。
4.2 一主多從一臺(tái)主庫(kù)多臺(tái)從庫(kù),A 為主庫(kù),負(fù)責(zé)讀寫,B、C、D為從庫(kù),負(fù)責(zé)讀數(shù)據(jù)。
如果 A 庫(kù)發(fā)生故障,B 庫(kù)成為主庫(kù)負(fù)責(zé)讀寫,C、D 負(fù)責(zé)讀,修復(fù)故障后,A 也成為從庫(kù),主庫(kù) B 同步數(shù)據(jù)到從庫(kù) A。
- 優(yōu)點(diǎn):多個(gè)從庫(kù)支持讀,分擔(dān)了主庫(kù)的壓力,明顯提升了讀的并發(fā)度。
- 缺點(diǎn):只有臺(tái)主機(jī)寫,因此寫的并發(fā)度不高。
基本上大公司,比如百度、滴滴,都是這種一主多從的模式,因?yàn)椴樵兞髁刻?,一定需要進(jìn)行讀寫分離,同時(shí)也需要支持服務(wù)的高可用、數(shù)據(jù)容災(zāi)。
分享文章:MySQL主從,六分鐘帶你掌握!
標(biāo)題網(wǎng)址:http://fisionsoft.com.cn/article/dpcspcd.html


咨詢
建站咨詢
