數(shù)據(jù)倉庫是大數(shù)據(jù)技術應用的重要體現(xiàn)方式之一,數(shù)據(jù)倉庫開發(fā)架構主要分為STG、ODS、DWD、DWS、ADS和DIM共6個層次,數(shù)據(jù)從底層開始,向上層進行傳遞、轉換、重組等操作,可以理解為,根據(jù)數(shù)據(jù)分析業(yè)務的需要,對原有的OLAP多維數(shù)據(jù),進行維度和指標的重新組合。層次的具體描述如下:
STG原始數(shù)據(jù)層:用來表示原始數(shù)據(jù)在數(shù)據(jù)倉庫的落地,數(shù)據(jù)結構和原始系統(tǒng)發(fā)送上來的保持一致。
ODS數(shù)據(jù)操作層:用于原始數(shù)據(jù)在數(shù)據(jù)平臺的落地。數(shù)據(jù)從數(shù)據(jù)結構、數(shù)據(jù)之間的邏輯關系上都與原始數(shù)據(jù)層基本保持一致。在源數(shù)據(jù)裝入這一層時,要進行諸如業(yè)務字段提取或去掉不用字段、臟數(shù)據(jù)處理等等。在實際中不一定會同時創(chuàng)建STG和ODS,因為兩個層差異不大,更多的是創(chuàng)建ODS層.
DWD數(shù)據(jù)明細層:用于源系統(tǒng)數(shù)據(jù)在數(shù)據(jù)平臺中的永久存儲。它用以支撐DWS層和ADS層無法覆蓋的需求,比如像用戶購買詳單類業(yè)務需求。這一層主要解決一些數(shù)據(jù)質(zhì)量問題和數(shù)據(jù)的完整度問題。
DWS數(shù)據(jù)服務層:數(shù)據(jù)匯總層,該層會在DWD層的數(shù)據(jù)基礎上。對數(shù)據(jù)做輕度的聚合操作,生成一系列的中間表,提升公共指標的復用性,減少重復加工。按照業(yè)務劃分,如流量、產(chǎn)品、用戶等,生成字段比較多的寬表,用于提供后續(xù)的業(yè)務查詢,OLAP分析,數(shù)據(jù)分發(fā)等。
ADS應用數(shù)據(jù)層:該層存放數(shù)據(jù)產(chǎn)品個性化的統(tǒng)計指標數(shù)據(jù),一般以某個業(yè)務應用為出發(fā)點進行建設,ADS層只關心自己需要的數(shù)據(jù),不會全盤考慮企業(yè)整體的數(shù)據(jù)架構和應用。面向?qū)嶋H的業(yè)務數(shù)據(jù)需求,以DWD或者DWS層的數(shù)據(jù)為基礎,組成各種統(tǒng)計報表。
DIM維度層:主要存儲公共的屬性數(shù)據(jù),比如產(chǎn)品類別、地理位置、時間詳情等信息。綜上所述,數(shù)據(jù)倉庫建設的主要工作,就是對原始業(yè)務數(shù)據(jù)進行匯聚,進行分層次的數(shù)據(jù)處理,生成業(yè)務需要的數(shù)據(jù),提供給前端業(yè)務使用。
更多關于大數(shù)據(jù)培訓的問題,歡迎咨詢千鋒教育在線名師,如果想要了解我們的師資、課程、項目實操的話可以點擊咨詢課程顧問,獲取試聽資格來試聽我們的課程,在線零距離接觸千鋒教育大咖名師,讓你輕松從入門到精通。