|
Post by sajahnali on Apr 28, 2024 14:20:03 GMT 8
这也是一个问题。虽然人类可以轻松识别“$US”、“USdollars”和“USD”都是同一件事,但计算机采用更规定的方法,如果无法识别数据元素,则会发出错误信号。小数点放错位置怎么办? 4.6% 的利率和 46.0% 的利率有很大差异。 但除了输入错误之外,如果业务的不同部分对常用术语使用不同的定义怎么办?在 2019 年 MISER 用户组会议上发表的数据治理演讲中,法拉盛高级副总裁兼数据治理和应用总监 Joan Roche 以及助理副总裁兼数据仓库分析师 Elizabeth LaBarbera 概述了常用定义面临的挑战,例如“平均客户余额”和“客户终身价值”,银行内不同业务部门的定义和计算方式不同。 在平均客户余额的情况下,两个不同的团队提出了截然不同的答案来呈现给高级管理层。财务部门使用总 美国数据 账中的信息,而 BI 分析师则使用数据仓库中的数据。事实上,两人都说得对!但总账平均值是基于日历年的,而分析师计算的是较长时期内的滚动平均值。问题在于缺乏定义和流程标准化。 然后就是时间问题。预测分析和建模需要准确的历史数据才能产生良好的结果。例如,当根据年龄、家庭规模、收入等预测哪些客户适合抵押贷款时,10 年前开户时错误输入出生日期可能会导致结果出现偏差。这可能会导致太晚瞄准潜在的抵押贷款客户,或者相反,太早提高利率并显得无关紧要。 在质量较差的数据和没有充分理解的流程的情况下做出关键决策并不是成功的秘诀。 另一个需要克服的关键障碍是这样的问题:谁拥有数据?银行的业务部门希望“拥有”数据,但不必修复它。他们期望数据仓库经理能够解决数据问题,但这些经理对数据本身知之甚少。他们管理记录、文件、文件夹、多维数据集等,这意味着它们的存储位置、方式以及谁有权访问。他们还促进报告创建,但他们不是数据管理员。 法拉盛的解决方案是创建一个数据治理计划,以明确定义术语并构建数据字典,确定每个数据领域的所有权,创建和执行有关如何收集和输入数据的指南,并出于合规性原因跟踪数据沿袭。
|
|