数据仓库的聚集优化
2007-09-27 15:24:00 来源:农村电气化
A-
A+
电力18讯: 摘要:基于数据仓库的决策支持系统为电力企业的信息化提供了很好的解决途径。作为数据仓库的关键技术之一,聚集优化技术承担着对现有数据仓库不断地进行优化,弥补了设计开发阶段的不足,该文着重对其在电力决策支持系统中的实现进行了研究,给出一套切实可行的实施步骤。
关键词:数据仓库;聚集优化;电力系统;决策支持
中图分类号:TP311.13 文献标志码:B 文章编号:1003-0867(2006)05-0039-03
近年来,电力企业的信息化建设有了长足的发展,主要体现在建立SCADA/EMS、DMS、MIS以及GIS等一些自动化应用系统,它们采集和保存了海量的电力系统运行数据,为电力企业进行科学决策提供了充足的数据资源。然而,各地区及部门间信息化建设的不平衡性和独立性,导致多数系统软件由不同的生产厂家提供,各种功能相对独立,数据不一致问题突出,相互之间的数据共享困难,难以提供企业级的决策分析支持。使得电力企业迫切需要为企业管理、决策分析等应用建造一个数据中心,数据仓库系统无疑是这类数据中心的一个好的实现方式。
本文在研究数据仓库技术在电力决策支持系统中应用的基础上,着重讨论聚集优化技术的具体实现。作为数据仓库的关键技术之一,聚集优化技术承担着对现有数据仓库不断地进行优化,弥补设计开发阶段的不足,提高数据仓库的运行效率以及可用性、实用性等重要任务,对于不断适应数据的变化和需求的变化,延长数据仓库的生命周期有着重大的意义。
1 数据仓库与聚集优化的概念
1.1 数据仓库
数据仓库是计算机应用的新领域,旨在通过通畅、合理、全面的信息管理,达到有效的决策支持。数据仓库较为准确概念,是 W.H.Inmon对数据仓库的定义:数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中决策制定过程。
数据仓库不同于传统的数据库,传统数据库中存放的是操作性的数据,主要用于联机事务处理(OLTP),也叫操作型处理,是指对数据库联机进行日常操作,它关心的是响应时间;而存放在数据仓库中的数据是分析性的数据,主要用于联机分析处理(OLAP),也称分析型处理,检索的内容随机性和数量更大,不但存储近期数据,也存储历史数据,且当前数据不断得到补充、更新,并可实现不同来源数据的融合,支持随机查询,为使用者提供更多的信息,而不是数据,为决策者提供了更好的决策支持,它是建立决策支持系统(DSS)的基础。
1.2 数据仓库优化和聚集优化
一般而言,当前主流数据仓库管理系统和联机分析服务器,都要求用户必须熟知企业模型、了解原始数据、对数据仓库具备相当程度的知识背景;然而对于电力企业在数据仓库设计和开发阶段,由于用户和开发人员对此认识可能是不同的或者是不足的,这将导致在使用过程中暴露出大量问题。因此如何根据系统运行的情况和用户需求的变化,对数据仓库不断地进行优化,弥补设计开发阶段的不足,以提高数据仓库的运行效率及可用性、实用性,成为数据仓库应用中迫切需要解决的一个重要问题。
作为数据仓库优化一项重要组成,数据聚集优化主要针对数据仓库数据聚集部分的选择而进行优化,它包括了对进入聚集空间的维、层次以及路径依据实际使用效果从获得最佳时间复杂度与空间复杂度的角度进行选择。具体而言,聚集通过对数据进行分组汇总,使数据到达一个用户感兴趣的层次,然后可以在这个概念更为清晰的数据集进行数据分析。例如对电力公司,可以聚集每天的电量,得到月、季、年的销售数据,然后再分析哪些因素对月、季、年的销售数据产生影响,而在聚集前的数据集,进行这种数据分析研究比较困难或可能本身就没有意义。
对于不同的用户和不同的应用所涉及的数据仓库操作可能访问不同或相同的聚集,采用预先计算聚集立方体,可以避免一部分聚集重复、冗余的运算,更重要的是由此带来响应速度的提高。然而预先计算所有可能的聚集即对所有的聚集进行物化(materializa-tion),将导致由一个海量数据集产生另一个海量数据集甚至空间爆炸,是很不现实的。因此选择在哪些维的哪些粒度层次进行聚集处理,以及采用何种路径实现聚集,与具体的应用密切相关,历来是数据仓库研究和实践中最为关心的核心问题。
2 在电力决策支持系统的应用
本节以在电力决策支持系统中实现数据仓库聚集的优化为目标,说明从数据仓库的构建,到聚集的优化算法实现的整个过程。
江苏恒源电力物资公司在生产管理的计算机应用起步较早,特别是经过近几年的努力,管理信息系统(MIS)被实实在在地应用于各个部门,其数据和功能不断得到实际的检验和完善,这为建立决策支持系统提供了良好的条件。由于现有的MIS系统中的数据比较准确,信息编码和命名体系也比较合理,故基本上沿用原来的定义,这样对项目进度有很大的促进。
2.1 数据仓库的建立
我们采用oracle 9i构建数
关键词:数据仓库;聚集优化;电力系统;决策支持
中图分类号:TP311.13 文献标志码:B 文章编号:1003-0867(2006)05-0039-03
近年来,电力企业的信息化建设有了长足的发展,主要体现在建立SCADA/EMS、DMS、MIS以及GIS等一些自动化应用系统,它们采集和保存了海量的电力系统运行数据,为电力企业进行科学决策提供了充足的数据资源。然而,各地区及部门间信息化建设的不平衡性和独立性,导致多数系统软件由不同的生产厂家提供,各种功能相对独立,数据不一致问题突出,相互之间的数据共享困难,难以提供企业级的决策分析支持。使得电力企业迫切需要为企业管理、决策分析等应用建造一个数据中心,数据仓库系统无疑是这类数据中心的一个好的实现方式。
本文在研究数据仓库技术在电力决策支持系统中应用的基础上,着重讨论聚集优化技术的具体实现。作为数据仓库的关键技术之一,聚集优化技术承担着对现有数据仓库不断地进行优化,弥补设计开发阶段的不足,提高数据仓库的运行效率以及可用性、实用性等重要任务,对于不断适应数据的变化和需求的变化,延长数据仓库的生命周期有着重大的意义。
1 数据仓库与聚集优化的概念
1.1 数据仓库
数据仓库是计算机应用的新领域,旨在通过通畅、合理、全面的信息管理,达到有效的决策支持。数据仓库较为准确概念,是 W.H.Inmon对数据仓库的定义:数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中决策制定过程。
数据仓库不同于传统的数据库,传统数据库中存放的是操作性的数据,主要用于联机事务处理(OLTP),也叫操作型处理,是指对数据库联机进行日常操作,它关心的是响应时间;而存放在数据仓库中的数据是分析性的数据,主要用于联机分析处理(OLAP),也称分析型处理,检索的内容随机性和数量更大,不但存储近期数据,也存储历史数据,且当前数据不断得到补充、更新,并可实现不同来源数据的融合,支持随机查询,为使用者提供更多的信息,而不是数据,为决策者提供了更好的决策支持,它是建立决策支持系统(DSS)的基础。
1.2 数据仓库优化和聚集优化
一般而言,当前主流数据仓库管理系统和联机分析服务器,都要求用户必须熟知企业模型、了解原始数据、对数据仓库具备相当程度的知识背景;然而对于电力企业在数据仓库设计和开发阶段,由于用户和开发人员对此认识可能是不同的或者是不足的,这将导致在使用过程中暴露出大量问题。因此如何根据系统运行的情况和用户需求的变化,对数据仓库不断地进行优化,弥补设计开发阶段的不足,以提高数据仓库的运行效率及可用性、实用性,成为数据仓库应用中迫切需要解决的一个重要问题。
作为数据仓库优化一项重要组成,数据聚集优化主要针对数据仓库数据聚集部分的选择而进行优化,它包括了对进入聚集空间的维、层次以及路径依据实际使用效果从获得最佳时间复杂度与空间复杂度的角度进行选择。具体而言,聚集通过对数据进行分组汇总,使数据到达一个用户感兴趣的层次,然后可以在这个概念更为清晰的数据集进行数据分析。例如对电力公司,可以聚集每天的电量,得到月、季、年的销售数据,然后再分析哪些因素对月、季、年的销售数据产生影响,而在聚集前的数据集,进行这种数据分析研究比较困难或可能本身就没有意义。
对于不同的用户和不同的应用所涉及的数据仓库操作可能访问不同或相同的聚集,采用预先计算聚集立方体,可以避免一部分聚集重复、冗余的运算,更重要的是由此带来响应速度的提高。然而预先计算所有可能的聚集即对所有的聚集进行物化(materializa-tion),将导致由一个海量数据集产生另一个海量数据集甚至空间爆炸,是很不现实的。因此选择在哪些维的哪些粒度层次进行聚集处理,以及采用何种路径实现聚集,与具体的应用密切相关,历来是数据仓库研究和实践中最为关心的核心问题。
2 在电力决策支持系统的应用
本节以在电力决策支持系统中实现数据仓库聚集的优化为目标,说明从数据仓库的构建,到聚集的优化算法实现的整个过程。
江苏恒源电力物资公司在生产管理的计算机应用起步较早,特别是经过近几年的努力,管理信息系统(MIS)被实实在在地应用于各个部门,其数据和功能不断得到实际的检验和完善,这为建立决策支持系统提供了良好的条件。由于现有的MIS系统中的数据比较准确,信息编码和命名体系也比较合理,故基本上沿用原来的定义,这样对项目进度有很大的促进。
2.1 数据仓库的建立
我们采用oracle 9i构建数
评论
最新评论(0)
相关新闻:
-
无相关信息