新聞中心
分布式存儲中的元數(shù)據(jù)管理
作者:佚名 2018-03-12 08:17:27
存儲
存儲軟件
分布式
數(shù)據(jù)管理 元數(shù)據(jù)(Metadata)是描述其它數(shù)據(jù)的數(shù)據(jù)(data about other data),或者說是用于提供某種資源的有關(guān)信息的結(jié)構(gòu)數(shù)據(jù)(structured data)。

創(chuàng)新互聯(lián)于2013年開始,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務公司,擁有項目網(wǎng)站制作、網(wǎng)站建設網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元玉泉街道做網(wǎng)站,已為上家服務,為玉泉街道各地企業(yè)和個人服務,聯(lián)系電話:18980820575
元數(shù)據(jù)被定義為:描述數(shù)據(jù)的數(shù)據(jù),對數(shù)據(jù)及信息資源的描述性信息。
元數(shù)據(jù)(Metadata)是描述其它數(shù)據(jù)的數(shù)據(jù)(data about other data),或者說是用于提供某種資源的有關(guān)信息的結(jié)構(gòu)數(shù)據(jù)(structured data)。元數(shù)據(jù)是描述信息資源或數(shù)據(jù)等對象的數(shù)據(jù),其使用目的在于:識別資源;評價資源;追蹤資源在使用過程中的變化;實現(xiàn)簡單高效地管理大量網(wǎng)絡化數(shù)據(jù);實現(xiàn)信息資源的有效發(fā)現(xiàn)、查找、一體化組織和對使用資源的有效管理。
對于元數(shù)據(jù)的管理目前有幾種常用的解決方案:中心節(jié)點管理元數(shù)據(jù),分布式管理元數(shù)據(jù),無元數(shù)據(jù)設計;本文談談三種方案的特點:
1、中心節(jié)點管理元數(shù)據(jù)
在設計分布式(存儲)系統(tǒng)時,使用中心節(jié)點是非常簡潔、清晰地一種方案,中心節(jié)點通常兼具元數(shù)據(jù)存儲與查詢、集群節(jié)點狀態(tài)管理、決策制定與任務下發(fā)等功能;
優(yōu)點:
A.由于其元數(shù)據(jù)集中式管理的特點,可以方便的處理集群運維管理的統(tǒng)計分析類需求;
B. 中心節(jié)點記錄了用戶數(shù)據(jù)的狀態(tài)信息(即元數(shù)據(jù)),在擴容時,可以選擇不做rebalance操作(rebalance引起的數(shù)據(jù)遷移可能帶來巨大的性能開銷),且仍能正常尋址;
缺點及解決方案:
a.單點故障是設計分布式系統(tǒng)最忌諱的問題之一,中心節(jié)點簡潔的設計也帶來了此問題,如何實現(xiàn)HA呢?;解決方案:(1)使用主備模型,主備之間使用同步或異步的方式進行增量或全量的數(shù)據(jù)同步(如TFS,mfs,HDFS2.0等),或者主備之間使用遠端共享存儲(如HDFS2.0,遠端存儲需要高可用);
b.存在性能和容量擴展上限,集中式中心節(jié)點自身硬件設施存在擴展(scale up)上限及查詢式尋址方式,導致此問題;即使client緩存元數(shù)據(jù)或使用緩存集群,也不能在根本上消除上限,在某些場景下(如海量小文件),此問題仍然存在;解決方案:(1)優(yōu)化升級硬件,如使用SSD,大內(nèi)存等機器;(2)當面臨此問題時,考慮使用分布式管理元數(shù)據(jù)方案。
2、分布式管理元數(shù)據(jù)
和中心節(jié)點的方案相似,只是將元數(shù)據(jù)分片并使用分布式節(jié)點管理存儲,在保有中心節(jié)點方案優(yōu)點的同時,解決了性能和容量擴展上限的問題,同時,多個節(jié)點同時提供元數(shù)據(jù)查詢服務,系統(tǒng)性能得到提升;
缺點
此類系統(tǒng)較為少見,系統(tǒng)本身結(jié)構(gòu)復雜,實現(xiàn)也有一定難度;
a.系統(tǒng)包含兩種相對獨立的分布式節(jié)點:元數(shù)據(jù)節(jié)點,數(shù)據(jù)節(jié)點,它們均是帶狀態(tài)節(jié)點,每種節(jié)點組成的分布式模塊都要面臨分布式CAP原則的取舍,都要做到可擴展,尤其是元數(shù)據(jù)對一致性有著更高要求;
b.元數(shù)據(jù)節(jié)點需要共同維護數(shù)據(jù)節(jié)點的狀態(tài),并在狀態(tài)變化時作出一致性的決策;這些都對系統(tǒng)的設計和實現(xiàn)構(gòu)成了很大挑戰(zhàn);
c.另外,大量元數(shù)據(jù)所需的存儲設備也是一筆不可忽略的成本開銷;
上面兩種方案有著共同思想:記錄并維護數(shù)據(jù)的狀態(tài)(即元數(shù)據(jù)),數(shù)據(jù)尋址時先向元數(shù)據(jù)服務器查詢,再存取實際數(shù)據(jù);
3、無元數(shù)據(jù)設計
主要以ceph為例,有別于上述二者的思想,此類系統(tǒng)的主要思想:使用算法計算尋址,尋址算法的輸入?yún)?shù)之一為集群狀態(tài)(如數(shù)據(jù)節(jié)點分布拓撲,權(quán)重,進程狀態(tài)等)的某種形式描述,此類常見算法有consistent hashing,Ceph RADOS系統(tǒng)的CRUSH算法,這類算法通常不直接管理用戶數(shù)據(jù),而是引入中間一層邏輯分片結(jié)構(gòu)(如consistent hashing的環(huán)片段,ceph的placement group),其粒度更大,其數(shù)量有限且相對固定,用戶存取的數(shù)據(jù)隸屬于其中唯一一個分片中,系統(tǒng)通過管理維護這些分片進而管理維護用戶數(shù)據(jù);此類系統(tǒng)有的也有中心配置管理節(jié)點(如ceph rados的monitor),只提供集群和分片等重要狀態(tài)的管理維護,不提供元數(shù)據(jù)的存儲查詢;
優(yōu)點:
A.如前所述,系統(tǒng)只需管理維護邏輯分片與集群狀態(tài)等信息,不存儲管理用戶數(shù)據(jù)的元數(shù)據(jù),系統(tǒng)的可擴展性大大增強,這在大量元數(shù)據(jù)場景時尤為明顯;
B.尋址算法所需的參數(shù)數(shù)據(jù)量小且相對固定,client可以通過緩存的方式,達到若干client并行尋址的目的,避免了尋址性能瓶頸;
缺點分析:
a.集群擴容時(甚至權(quán)重改變時),需要做rebalance,尤其是數(shù)據(jù)規(guī)模很大(PB級以上)的集群,由此帶來的大量數(shù)據(jù)遷移使集群一直處于高負載的狀態(tài),進而使得正常業(yè)務請求的延時、iops等性能指標下降;但有些場景做集群擴容時,并不希望做rebalance(如集群容量不足);對此,常見策略是每個集群預先做好性能、容量評估,需要擴容時,直接新建集群;如果單個集群必須做rebalance,通過人工干預限流降低集群負載;至于需要做rebalance的根本原因,本人認為擴容導致集群狀態(tài)改變,進而導致尋址算法結(jié)果改變,最終數(shù)據(jù)分布也需隨之改變;
b.數(shù)據(jù)的副本分布位置通過尋址算法計算得出,位置相對固定,幾乎不可人為調(diào)整;但通常可以通過改變權(quán)重的方式改變數(shù)據(jù)總體分布情況;
c.中心配置管理節(jié)點只管理分片信息,不知道單個用戶數(shù)據(jù)的信息,統(tǒng)計分析類的需求需要通過定期地收集數(shù)據(jù)節(jié)點信息等方式實現(xiàn),并存儲維護。
總結(jié):通過以上比較分析,三類系統(tǒng)的尋址策略,使系統(tǒng)本身均有自己相應的優(yōu)缺點,它們都不是***的,但都有其適宜的場景和業(yè)務,在系統(tǒng)設計與選型時,需要做全面的考量。
標題名稱:分布式存儲中的元數(shù)據(jù)管理
當前網(wǎng)址:http://fisionsoft.com.cn/article/djhgjhp.html


咨詢
建站咨詢
