基于网络的省级电力GIS数据库设计* [图文]
2006-01-18 11:35:36 来源:
A-
A+
电力18讯: 摘 要 以"贵州省电力地理信息系统(GIS)"为例,探讨了网络环境下数据库设计的范式要求和网络要求。
关键词 地理信息系统;规范化;范式;C/S
中图分类号 TP311.13;TP399:TP393 文献标识码 B
0 前 言
地理信息系统(Geographic Information System,以下简称GIS)是地理属性数据与关系属性数据完美的结合。省电力GIS系统是为应用于网络环境而设计的,这套系统用Sybase server作为后端支持数据库。系统中关系属性数据部分的性能,包括一定时间内的数据吞吐量、数据的完整性安全性、用户查询响应时间等。要获得好的系统性能,数据库的逻辑设计是其中重要的一环。
关系型数据库是一种常用的数据库结构。1971年E.F.Codd博士首先提出了关系数据库的规范化理论,之后,此理论不断深化、完善。规范化理论不仅仅是设计关系模式的理论指导和强有力的工具,对其它数据模型数据库的逻辑设计也同样有理论意义,在基于网络的数据库开发过程中也应该对数据库进行规范化处理。数据库的规范化程度影响着系统的性能,但由于网络应用的特点,这就要求数据库不但要满足一定范式,且要满足一定网络要求:数据查询时简单、快速,网络数据流量小。在省级电力GIS系统的设计中我们综合考虑了数据库规范化与网络应用的特点。
1 系统中逻辑数据库的范式设计
未经规范化的数据库一般都有下述缺点:较大的数据冗余,数据一致性差,数据修改复杂,对表进行插入删除时会产生异常。规范化的作用就在于尽量去除冗余,使数据保持一致,使数据修改简单,除去在表中进行插入删除时产生的异常。规范化后的表一般都较小,而在Sybase中数据页的大小是2k,小的表意味着一个数据页中可以包含较多的记录,这样客户端用户就可在同样的时间内获得所需的更多数据记录,从而减少客户端与服务器端的物理I/O,减轻网络的负担。
以下讲述中用到以下术语及表示(限于篇幅,不作详解,请参阅文献[1]):
Y函数依赖于X记作:X→Y;Y函数完全依赖于X记作:
Y函数部分依赖于X记作:;Z传递函数依赖于Y记作:
关系R具有连接依赖记作:JD*(X1,X2,…,XN)(JD:Join Dependentcy);Y多值依赖于X记作:X→→Y
1.1 第一范式(1NF)
定义:如果关系R 中所有属性的值域都是单纯域,那么关系模式R是第一范式的,记作R∈1NF。
这一限制是关系的基本性质,所以任何关系都必须满足第一范式。在仅满足1NF的表中,数据冗余大、修改量大、插入删除时会有异常,由此我们引入2NF。
1.2 第二范式(2NF)
定义:如果关系模式R是第一范式的,而且关系中每一个非主属性不部分依赖于主键,称R是第二范式的,记作:R∈2NF。
不满足2NF的关系会产生前面讲的插入异常、删除异常、修改复杂,解决办法是用投影分解。 数据库的1NF与2NF较易取得,在此不再举例赘述。
1.3 第三范式(3NF)
定义:如果关系模式R是2NF的,且每一个非主属性都不传递依赖于主键,称R是第三范式的,记作R∈3NF。
反例:下表表示关系R3(sbbh,czmc,czdz,sbxh),其中sbbh构成主键。
设备编码(sbbm)
厂站名称(czmc)
厂站地址(czdz)
设备型号(sbxh)
10101
清镇发电厂
清镇
E66II飞机翼
分析上表的函数依赖,由sbbh→czmc,czmc→sbbh,czmc→czdz,得sbbh→czdz,所以,因而有时仍会产生类似满足2NF的问题。解决办法:将R3分解为R31(sbbh,czmc,sbxh),R32(czmc,czdz)。分解后的R31和R32中不再存在传递依赖。
3NF去除了非主属性对主键的部分函数依赖和传递函数依赖。一般满足3NF的关系模式已能消除冗余和各种异常现象,获得较满意的效果,但无论2NF还是3NF都没有涉及主属性间的函数依赖,所以有时仍会引起一些问题。由此我们引入BC范式(BCNF,Boyeet和Codd提出),通常认为BCNF是第三范式的改进。
BC范式的定义:如果关系模式R∈1NF,且R中每一个决定因素都是候选键,则R是满足BC范式的关系,记作R∈BCNF。
当一个关系模式R∈BCNF,则在函数依赖范畴里,已实现了分离,消除了插入、删除的异常。
1.4 第四范式(4NF)
第四范式是BC范式的推广,是针对有多值依赖的关系模式所定义的规范化形式。
定义:关系模式R∈1NF,X、Y是U的非空子集,,Z=U-X-Y也非空。此时若X→→Y,则X必包含R的主键,称R是第四范式的,记作:R∈4NF。
反例:下表表示关系R4(sbm,cz#,sccj)。
设备名(sbm)
厂站代码(czdm)
生产厂家(sccj)
引风机
101
匈牙利
引风机
101
沈阳风机厂
引风机
101
成都电力机械厂
引风机
102
沈阳风机厂
关键词 地理信息系统;规范化;范式;C/S
中图分类号 TP311.13;TP399:TP393 文献标识码 B
0 前 言
地理信息系统(Geographic Information System,以下简称GIS)是地理属性数据与关系属性数据完美的结合。省电力GIS系统是为应用于网络环境而设计的,这套系统用Sybase server作为后端支持数据库。系统中关系属性数据部分的性能,包括一定时间内的数据吞吐量、数据的完整性安全性、用户查询响应时间等。要获得好的系统性能,数据库的逻辑设计是其中重要的一环。
关系型数据库是一种常用的数据库结构。1971年E.F.Codd博士首先提出了关系数据库的规范化理论,之后,此理论不断深化、完善。规范化理论不仅仅是设计关系模式的理论指导和强有力的工具,对其它数据模型数据库的逻辑设计也同样有理论意义,在基于网络的数据库开发过程中也应该对数据库进行规范化处理。数据库的规范化程度影响着系统的性能,但由于网络应用的特点,这就要求数据库不但要满足一定范式,且要满足一定网络要求:数据查询时简单、快速,网络数据流量小。在省级电力GIS系统的设计中我们综合考虑了数据库规范化与网络应用的特点。
1 系统中逻辑数据库的范式设计
未经规范化的数据库一般都有下述缺点:较大的数据冗余,数据一致性差,数据修改复杂,对表进行插入删除时会产生异常。规范化的作用就在于尽量去除冗余,使数据保持一致,使数据修改简单,除去在表中进行插入删除时产生的异常。规范化后的表一般都较小,而在Sybase中数据页的大小是2k,小的表意味着一个数据页中可以包含较多的记录,这样客户端用户就可在同样的时间内获得所需的更多数据记录,从而减少客户端与服务器端的物理I/O,减轻网络的负担。
以下讲述中用到以下术语及表示(限于篇幅,不作详解,请参阅文献[1]):
Y函数依赖于X记作:X→Y;Y函数完全依赖于X记作:
Y函数部分依赖于X记作:;Z传递函数依赖于Y记作:
关系R具有连接依赖记作:JD*(X1,X2,…,XN)(JD:Join Dependentcy);Y多值依赖于X记作:X→→Y
1.1 第一范式(1NF)
定义:如果关系R 中所有属性的值域都是单纯域,那么关系模式R是第一范式的,记作R∈1NF。
这一限制是关系的基本性质,所以任何关系都必须满足第一范式。在仅满足1NF的表中,数据冗余大、修改量大、插入删除时会有异常,由此我们引入2NF。
1.2 第二范式(2NF)
定义:如果关系模式R是第一范式的,而且关系中每一个非主属性不部分依赖于主键,称R是第二范式的,记作:R∈2NF。
不满足2NF的关系会产生前面讲的插入异常、删除异常、修改复杂,解决办法是用投影分解。 数据库的1NF与2NF较易取得,在此不再举例赘述。
1.3 第三范式(3NF)
定义:如果关系模式R是2NF的,且每一个非主属性都不传递依赖于主键,称R是第三范式的,记作R∈3NF。
反例:下表表示关系R3(sbbh,czmc,czdz,sbxh),其中sbbh构成主键。
设备编码(sbbm)
厂站名称(czmc)
厂站地址(czdz)
设备型号(sbxh)
10101
清镇发电厂
清镇
E66II飞机翼
分析上表的函数依赖,由sbbh→czmc,czmc→sbbh,czmc→czdz,得sbbh→czdz,所以,因而有时仍会产生类似满足2NF的问题。解决办法:将R3分解为R31(sbbh,czmc,sbxh),R32(czmc,czdz)。分解后的R31和R32中不再存在传递依赖。
3NF去除了非主属性对主键的部分函数依赖和传递函数依赖。一般满足3NF的关系模式已能消除冗余和各种异常现象,获得较满意的效果,但无论2NF还是3NF都没有涉及主属性间的函数依赖,所以有时仍会引起一些问题。由此我们引入BC范式(BCNF,Boyeet和Codd提出),通常认为BCNF是第三范式的改进。
BC范式的定义:如果关系模式R∈1NF,且R中每一个决定因素都是候选键,则R是满足BC范式的关系,记作R∈BCNF。
当一个关系模式R∈BCNF,则在函数依赖范畴里,已实现了分离,消除了插入、删除的异常。
1.4 第四范式(4NF)
第四范式是BC范式的推广,是针对有多值依赖的关系模式所定义的规范化形式。
定义:关系模式R∈1NF,X、Y是U的非空子集,,Z=U-X-Y也非空。此时若X→→Y,则X必包含R的主键,称R是第四范式的,记作:R∈4NF。
反例:下表表示关系R4(sbm,cz#,sccj)。
设备名(sbm)
厂站代码(czdm)
生产厂家(sccj)
引风机
101
匈牙利
引风机
101
沈阳风机厂
引风机
101
成都电力机械厂
引风机
102
沈阳风机厂