自顶向下还是自底向上的数据模型设计,哪个更好?

拥抱科技有未来 2024-10-06 10:14:32

在设计企业有效数据策略时,组织通常在自顶向下和自底向上方法之间进行选择。每种方法都有其独特的优点,适用于各种场景。自顶向下方法从业务需求和战略目标的高级视图开始,然后逐渐将该视图分解为详细的数据结构和组件。而自底向上的方法则从现有的数据源和系统入手,专注于具体的细节,逐步发展成一个完整的数据模型。将方法的选择与组织的战略目标、数据管理需求和现有基础设施保持一致是至关重要的。在某些情况下,集成两种风格的混合方法可能是最有效的解决方案。

根据DAMA国际数据管理知识体系指南,企业数据架构通常由三组主要的设计组件组成。首先,企业数据模型(EDM)是一个集成的、面向主题的数据模型,它定义了在整个组织中产生和使用的基本数据。EDM定义主题领域、业务实体、规则和基本数据属性。接下来是信息价值链分析,它使数据模型与业务流程、组织角色、应用程序和技术平台保持一致。最后,相关的数据交付体系结构包括数据技术体系结构、数据集成、数据仓库、商业智能、用于内容管理的企业分类法和元数据体系结构。

最佳实践包括分层构建EDM,以自顶向下或自底向上的方法关注最关键的业务主题领域。EDM中这些层的简要概述由四个部分组成。

主题区域模型。这标识了定义企业范围的主要业务主题领域。

概念数据模型。下一层定义业务实体及其关系,并包括业务定义和元数据的术语表。

逻辑数据模型。该模型标识业务实体的每个实例所需的数据。EDM中反映的基本数据属性代表了广泛共享的数据属性的共同需求和标准化定义。

物理数据模型。最后一层是物理层,表示主机系统工件(物理数据对象)的组合,这些工件来源于逻辑数据模型及其所需的存储配置。它详细介绍了表、列、数据类型、键和约束的存储配置。

自顶向下方法

企业数据建模的自顶向下方法从业务需求的总体视角开始,并将其分解为更具体的元素。这是因为如果数据策略与业务需求不一致,那么收集到的数据将是无用的。自顶向下的方法优先于掌握更广泛的业务流程和战略目标,然后再关注企业数据模型的详细组件。

自顶而下的方法考虑公司的目标,从对组织需求的透彻理解开始。通过提供数据体系结构的全面视图,此方法有助于改进本地或全球范围内各种业务单位和系统之间的集成。这种方法通过确定高级需求的优先级,降低了忽略数据模型中基本业务需求的风险。

一些缺点包括更大的工作量和复杂性,以及对广泛分析和迭代改进的更高时间投资。基于现有业务策略构建量身定制的方法意味着不知道为什么或为多少构建系统。总体模型有可能与实际的、真实世界的应用程序问题脱节,特别是在初始需求不明确或没有正确记录的情况下。

当目标和策略不一致时,挑战就会出现,严格的策略是最有效的。没有全面掌握技术能力的决策者可以组织一个深入了解公司需求的专家团队。建立关键的数据元素,如策略、所有权和管理是至关重要的。失去资深业务主题专家(SME)是当前最严重的问题之一,因此在新员工入职时,培训至关重要。

自底向上的方法

相反,自底向上方法首先彻底检查当前的数据和系统,逐步开发统一的企业数据模型。这种方法强调利用现有的数据结构和系统来创建一个全面的数据体系结构,首先收集和摄取可用的数据源,然后构建特定于领域的数据模型,如数据网格、数据仓库和应用程序系统。

自底向上方法使用当前的数据结构和系统,如果组织已经拥有大量的数据基础设施并了解其需求,那么这种方法可能是有益的。因此,它通常更容易执行,从而可能导致更少的中断和更可行的解决方案。这种方法允许逐步发展和整合,简化了解决问题和进行必要调整的过程。

一个缺点是,自底向上方法可能不完全符合总体业务目标或战略目标,因为它从预先存在的数据开始。此外,也有可能加强目前的数据孤岛和效率低下,因为这种方法强调现有系统的整合,而不一定解决基本的结构问题。组合各种数据源可能非常复杂且具有挑战性,特别是在质量、数据格式或含义存在显著差异的情况下。当决策者没有在过程的早期看到最终结果的价值时,自底向上方法的一个重大挑战就出现了。这可能会导致由于成本原因而无法完成实施,或者最终使用单点数据系统,从而产生长期问题。

为特定的业务目标采取错误的方法通常会导致战略失败,需要从头开始重新设计。如果实现过程成功,则结果可能无法完全支持业务需求,并且可能需要重新启动;遗留系统最终可能会比新系统更好。在制定数据战略时,坚持三个p——人、过程和产品(People, Process, Product)——是成功的基础。

最佳实践

数据策略的KPI可以包含各种类别,包括评估准确性、完整性、及时性和有效性等方面的数据质量度量。效率可以通过可用性、延迟和吞吐量度量来衡量。数据价值可以通过投资回报(ROI)、收入或成本节约来评估,而一致性度量包括满意度、采用率和参与度。

下面的建议可以帮助组织获得最大的成功机会。

·业务目标一致性。将业务目标与业务远景和战略结合起来,同时保持对结果的现实期望,这是至关重要的。

·研究。研究适用的技术并对相关数据和技术进行优先排序,避免与业务目标不兼容,从而节省时间并降低成本。

可伸缩性。包括可伸缩性计划和应用行业框架的简单策略简化了实现。

·数据治理。设计一个全面的数据治理计划对于满足所有法规和数据需求至关重要。

·验证。在进行之前的每个阶段都要仔细检查,避免浪费时间和资源。

·灵活性。保持灵活性和不断地重新评估目标可以使企业在竞争中保持领先地位。例如,可口可乐公司通过数字化将其数据收集到一个模型中,这在疫情期间及之后对其业务有很大帮助。

自顶向下和自底向上方法各有优缺点,一些决策者可能会选择混合方法。确定正确的方法将基于组织的独特环境和需求。将整体战略与具体的、可操作的见解相结合,使公司能够开发强大、灵活、实用的数据框架,从而提高决策和运营效率。

0 阅读:5