数据血缘和数据治理的关系

数据血缘和数据治理的关系

数据血缘，这个已经不是什么很新鲜的概念了。

数据的血缘关系，其实可以类比人的血缘关系。

每个人都有长辈，比如爸爸和爷爷，我们大部分人都知道自己的爸爸和爷爷是谁。

因为他们和我们距离很近，包括时间上的和空间上的距离。

但是爷爷的爷爷是谁，估计知道的人就不多了。

如果想知道，估计就得看族谱或者问长辈了。

数据血缘也是一样，随着业务复杂度的增长，数据被加工的流程越来越长。

数据之间的距离越来越远，分支越来越多。

想知道末端数据的来源，变得原来越困难。

举个例子，

当末端分支出现两个名字一样或相近，

但值不一样的数据时，

场面就很尴尬，数据的使用者就会感到很迷茫。

为了弄清楚它们的区别，要花上大量的时间。

这时，就需要专门的人对数据进行管理。

形成数据血缘关系，也就是数据的族谱。

建立起数据血缘关系，属于数据治理的一项重要工作内容。

2020-04-06 22:25:25 | 张良 | 技术 & 提问 | 阅读523次

回复 :