為什么企業(yè)對自身內(nèi)部的數(shù)據(jù)資產(chǎn)總是混沌不清?其實是缺少一種有效的工具來進(jìn)行數(shù)據(jù)資產(chǎn)的梳理和盤點。而元數(shù)據(jù)管理工具就是一種有有效的盤點工具或手段。
元數(shù)據(jù)是企業(yè)中用來描述數(shù)據(jù)的數(shù)據(jù)。元數(shù)據(jù)(metadata) 是關(guān)于數(shù)據(jù)的組織、數(shù)據(jù)域及其關(guān)系的信息。它可理解為比一般意義的數(shù)據(jù)范疇更加廣泛的數(shù)據(jù),不再僅僅表示數(shù)據(jù)的類型、名稱、值等信息,它可以進(jìn)一步提供數(shù)據(jù)的上下文描述信息,比如數(shù)據(jù)的所屬域、取值范圍、數(shù)據(jù)間的關(guān)系、業(yè)務(wù)規(guī)則,甚至是數(shù)據(jù)的來源。在數(shù)據(jù)分析中,元數(shù)據(jù)可以幫助DW管理員和DW開發(fā)人員非常方便地找到他們所關(guān)心的數(shù)據(jù)。
元數(shù)據(jù)相當(dāng)于企業(yè)數(shù)據(jù)的DNA,它可以告訴你,有用的數(shù)據(jù)在哪里,能提供一份數(shù)據(jù)結(jié)構(gòu)定義和元素的詳細(xì)示意圖,數(shù)據(jù)來龍去脈、關(guān)系,使應(yīng)用開發(fā)過程更有效,提供數(shù)據(jù)的參照性、引用性、血緣分析、影響分析、變化分析....
簡單地說,元數(shù)據(jù)管理是為了對數(shù)據(jù)資產(chǎn)進(jìn)行有效的組織。它使用元數(shù)據(jù)來幫助管理他們的數(shù)據(jù)。它還可以幫助數(shù)據(jù)專業(yè)人員收集、組織、訪問和豐富元數(shù)據(jù),以支持?jǐn)?shù)據(jù)治理。
元數(shù)據(jù)管理的3個目標(biāo)
企業(yè)元數(shù)據(jù)管理的本質(zhì)是有效利用企業(yè)數(shù)據(jù)資產(chǎn),讓數(shù)據(jù)發(fā)揮出盡可能大的價值。元數(shù)據(jù)管理可以幫助業(yè)務(wù)分析師、系統(tǒng)架構(gòu)師、數(shù)據(jù)倉庫工程師和軟件開發(fā)工程師等相關(guān)干系人清楚地知道企業(yè)擁有什么數(shù)據(jù),它們存儲在哪里,如何抽取、清理、維護(hù)這些數(shù)據(jù)并指導(dǎo)用戶使用。
以下元數(shù)據(jù)管理目標(biāo)是企業(yè)的普遍訴求。
1、建立指標(biāo)解釋體系
滿足用戶對業(yè)務(wù)和數(shù)據(jù)理解的需求,建立標(biāo)準(zhǔn)的企業(yè)內(nèi)部知識傳承的信息承載平臺,建立業(yè)務(wù)分析知識庫,實現(xiàn)知識共享。能夠回答以下問題:
?企業(yè)有哪些數(shù)據(jù)?
?什么是企業(yè)有效客戶?有效客戶和客戶有何區(qū)別?
?什么是產(chǎn)品的生命周期?
?這個數(shù)據(jù)還叫什么名字?
?數(shù)據(jù)倉庫中的存儲過程是誰寫的?它用來干什么?現(xiàn)在還在用嗎?
典型應(yīng)用有數(shù)據(jù)資源目錄和業(yè)務(wù)術(shù)語表。
2、提高數(shù)據(jù)溯源能力
讓用戶能夠清晰地了解數(shù)據(jù)倉庫中數(shù)據(jù)流的來龍去脈、業(yè)務(wù)處理規(guī)則、轉(zhuǎn)換情況等,提高數(shù)據(jù)的溯源能力,支持?jǐn)?shù)據(jù)倉庫的成長需求,降低因員工換崗造成的影響。元數(shù)據(jù)有助于回答以下問題:
?這張表是從哪個業(yè)務(wù)系統(tǒng)中抽取過來的?
?ETL過程是否對數(shù)據(jù)進(jìn)行過加工處理?進(jìn)行了哪些處理?
?指標(biāo)數(shù)據(jù)是從哪些表匯總計算出來的?
典型應(yīng)用有血緣分析、影響分析、全鏈路分析。
3、數(shù)據(jù)質(zhì)量稽核體系
通過非冗余、非重復(fù)的元數(shù)據(jù)信息提高數(shù)據(jù)完整性、準(zhǔn)確性。元數(shù)據(jù)管理解決的問題是如何將業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)分門別類地進(jìn)行管理,建立報警、監(jiān)控機(jī)制,出現(xiàn)故障時能及時發(fā)現(xiàn)問題,為數(shù)據(jù)倉庫的數(shù)據(jù)質(zhì)量監(jiān)控提供基礎(chǔ)素材。能夠回答以下問題:
?今天的在線用戶數(shù)為什么是0?
?為什么A報表中的本月收入值與B報表中的不同?
典型應(yīng)用有指標(biāo)標(biāo)準(zhǔn)和數(shù)據(jù)質(zhì)量規(guī)則。