新聞中心
事實表:記錄公司的一筆正常的業(yè)務(wù)數(shù)據(jù),需要提供 4W ,什么時候 (When) 在什么地方 (Where) 有哪些人 (Who) 做了什么事 (What) 。為了方便后續(xù)分析,在設(shè)計事實表的時候,我們應(yīng)該盡可能的提供詳細(xì)的維度信息和度量信息。
比如我們在談一家物流公司的數(shù)據(jù)倉庫的時候,如何去設(shè)計落地一個事實表,我們按以下過程來落地。
1 :用戶的目的:首先我們需要知道用戶的目的,以價值為導(dǎo)向,解決用戶的問題,這時用戶會提出,目前公司營運成本太高,今年需要節(jié)省多少費用。
2 :定義指標(biāo):針對上面的目標(biāo),我們需要與用戶一起來分析這個目標(biāo),可以用哪些指標(biāo)來衡量這個目標(biāo)往預(yù)期方向走,也就是我們所說的拆分目標(biāo),這個過程會多次溝通,反復(fù)的拆分和合并之前定義的指標(biāo),比如說最終我們統(tǒng)一認(rèn)定有裝載率、車輛營運公里數(shù)、單公斤成本,單公里成本這 4 個指標(biāo)。
3 :指標(biāo)細(xì)分:指標(biāo)確認(rèn)后,我們就需要細(xì)分指標(biāo)數(shù)據(jù) ( 多級指標(biāo) ) ,比如裝載率這個指標(biāo),我們是否需要針對業(yè)務(wù)場景,區(qū)分早、中、晚時段的裝載情況,不同車型 (5KG,10KG) 的裝載率情況,對于單公斤成本和單公里成本我們是否需要清楚知道成本的費用項,比如司機成本、油費成本、車輛折舊成本等。
4 :定義相關(guān)字段和邏輯:有了以上細(xì)分指標(biāo)的確定,接下來我們只與用戶確認(rèn)各個指標(biāo)的邏輯和取數(shù)口徑了, 設(shè)計好事實表的字段,驗證是否滿足用戶的目的數(shù)據(jù)應(yīng)用,假如有如下系統(tǒng),我們對每個事實表字段確認(rèn)源系統(tǒng)和后臺表字段關(guān)系。
a :車輛調(diào)度系統(tǒng):什么時候哪個車跑了哪條線。
b :結(jié)算系統(tǒng):每次車的費用是多少。
c :裝載系統(tǒng):每個車每個線路的業(yè)務(wù)量信息。
5 :有了這些指標(biāo)后我們快速實現(xiàn)和落地,提供一些分析報告,對前端業(yè)務(wù)做些改進(jìn)方案,再來驗證我們的指標(biāo)是否往好的方向改變,同時成本也在降低,哪么我們整個方案和指標(biāo)定義的非常好,如果指標(biāo)在往好的方向改變,但成本并沒有降低,哪么我們就要重新來定義某些指標(biāo)是否正確了,就這樣的一直迭代直到我們達(dá)到用戶的目標(biāo)。
維度表:是對事實表里的維度進(jìn)行擴(kuò)展更詳細(xì)的信息補充。我們在定義一個維度表的時候,需要怎樣設(shè)計呢?比如在事實表里有客戶這樣的一個維度,我們與用戶溝通在他們來看客戶這個維度主要關(guān)心的是哪些信息,達(dá)到什么樣的目的,用戶一般會想達(dá)到用戶差異化的管理和銷售,哪么我們就要抓住如何來區(qū)分客戶的差異化的信息:
1 :基本屬性:比如像客戶規(guī)模( 1 千人、 1 萬人)、地域(深圳、廣州等)、行業(yè)(制造、互聯(lián)網(wǎng)等)。
2 :按客戶行為:層級(大客戶、散客等)、銷售量( 0-100 , 101-500 , 501-1000 等)。
文章標(biāo)題:2-dw_事實表、維度表-創(chuàng)新互聯(lián)
當(dāng)前URL:http://fisionsoft.com.cn/article/diiceg.html