|
[程序员]数据库部分 读书笔记
|
1 基本概念
数据库:长期存储在计算机内,有组织、可共享的数据集合。
特点:
具有面向全组织的、复杂的数据结构
数据冗余少,容易扩充
具有数据和程序的独立性
具有一定的数据控制功能
数据库系统:从广义上讲是由数据库,硬件,软件和相关人员组成的。
数据库管理系统:是解决如何科学的组织和存储数据,如何高效的获取和维护数据的系统软件。
人员:
第一类为系统分析员和数据库设计人员
第二类为应用程序员,
第三类为最终用户
第四类为数据库管理员(DataBase Administrator, DBA)
数据库管理技术的发展
人工管理阶段
文件系统阶段 特点如下:
数据可以长期保留,数据的逻辑结构和物力结构有了区别,程序可以按名访问,不关心数据存储的物理位置,由文件系统提供存取方法。
数据不属于某个特定的应用,即应用程序和数据之间不再是直接的对应关系,可以重复使用。
文件组织形式的多样化,有索引文件,链接文件和Hash文件等。
缺点是数据冗余度大,存在数据不一致性,数据联系弱。
数据库系统阶段
特点:
采用复杂的数据模型表示数据结构
有较高的数据独立性
数据控制功能
数据库的安全性保护
数据的完整性
并发控制
故障恢复
2 数据模型
模型时对现实世界特征的模拟和抽象。数据模型是对现实世界数据特征的抽象。
属性与字段:属性用于描述实体某方面的特性,字段用于标记实体属性的命令单位。
实体与记录:实体表示客观存在并能区别的事物。记录是字段的有序集合
码与记录码:码是能唯一区分实体的属性或属性集,记录码是惟一标识文件中的每条记录的字段或字段集。
实体集与文件:实体集是具有共同特性的实体的集合,文件是同一类记录的汇集。
实体型与记录型:实体型是属性的集合,记录型是记录的结构定义。
数据模型的三要素是数据结构、数据操作、数据的约束条件。
数据结构是所研究的对象类型的集合,是对系统静态特性的描述。
数据操作是对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及操作规则。
数据的约束条件是一组完整性规则的集合。
最常用的数据模型分为概念数据模型和基本数据模型
概念数据模型也称信息模型,是按用户的观点对数据和信息建模,是现实世界到信息世界的第一层抽象。
基本数据模型是按计算机系统的观点对数据模型,是现实世界数据特征的抽象,用于DBMS的实现。
实体-联系模型简称E - R模型,所采用的三个主要概念是:实体、联系和属性。
实体是现实世界中可以区别于其他对象的“事件”或“物体”。
实体的联系分为实体内部的联系和实体与实体之间的联系。实体间的联系类型有一对一、一对多和多对多。
属性是实体某方面的特性。E – R模型中的属性有如下分类:
简单属性和复合属性
单值属性和多值属性
NULL属性
派生属性
层次模型
层次模型采用树型结构表示数据与数据间的联系。在层次模型中,每一个结点表示一个记录型(实体),记录之间的联系用结点之间的连线表示,并且根结点以外的其他结点有且仅有一个双亲结点。
层次模型不能直接表示多对多的联系。可采用两种方法:
冗余结点法:将两个实体的多对多的联系转换为两个一对多的联系。
采用虚拟结点分解法:将冗余结点转换为虚拟结点。
用E – R模型表示现实世界的问题
学校有若干个系,每个系有若干名教师和学生;每个教师可以担任若干门课程,并参加多项项目;每个学生可以同时选修多门课程。请设计某学校的教学管理的E – R模型,要求给出每个实体、联系的属性。
解:某学校的教学管理的E-R模型应该有5个实体:系、教师、学生、项目、课程。
(1) 设计各实体属性如下:
系:系号,系名,主任名。
教师:教师号,教师名,职称。
学生:学号,姓名,年龄,性别。
项目:项目号,名称,负责人。
课程:课程号,课程名,学分。
(2)各实体间的联系有:教师担任课程的m:n “选修”联系;教师、学生与系之间的所属关系的1: n : m“领导”联系。其中“参加”联系有一个排名属性,“选修”联系有一个成绩属性。
3 DBMS的功能和特征
DBMS主要用于实现对共享数据的有效的组织、管理和存取。
数据定义:数据定义语言(Data Definition Language, DDL)
数据库操作:数据操纵语言(Data Manipulation Language, DML)
数据库运行管理
数据组织、存储和管理
数据库的建立和维护
数据库的建立和维护包括数据库的初始建立、数据的转换、数据库的转储和恢复、数据库的重组和重构、性能监测和分析
DBMS的特征:
数据结构化且统一管理
有较高的数据独立性
数据控制功能
数据库的安全性保护:数据库的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。
数据库的完整性:数据库的完整性包括数据库的正确性和相容性,指防止合法用户使用数据库时向数据库加入不符合语义的数据,保证数据库中数据时正确的,避免非法的更新。
并发控制:协调并发事务的执行,保证数据库的完整性不受破坏,避免用户得到不正确的数据。丢失更新、不可重复读和读脏数据。
故障恢复:数据库中的四类故障时事务内部故障、系统故障、介质故障及计算机病毒。
4 数据库系统体系结构
概念模式:概念模式也称模式,使数据库中全部数据的逻辑结构和特征的描述,它由若干个概念记录型组成。概念模式反映的是数据库的结构及其联系。 描述概念模式的数据定义语言称为“模式DDL”(schema Data Definition Language)
外模式:外模式也称为用户模式或子模式,是用户与数据库系统的接口,是用户用到的那部分数据的描述。由若干个外部记录类型组成。描述外模式的数据定义语言称为“外模式DDL”
内模式:内模式也称为存储模式,是数据无力结构和存储方式的描述,是数据在数据库内部的表示方式。描述内模式的数据定义语言称为“内模式DLL”。
数据按外模式的描述提供给用户,按内内模式的描述存储在磁盘上,而概念模式提供了连接这两级模式的相对稳定的中间观点,并使得两级的任意一级的改变都不受另外一级的限制。
两级映像:模式/内模式映像、外模式/模式映像。
数据库系统的体系结构
集中式数据库系统
C/S数据库体系结构
并行数据库系统
分布式数据库系统
数据的独立性是指数据与程序独立,将数据的定义从程序中分离出去,由DBMS负责数据的存储,从而简化应用程序,大大减少应用程序编制的工作量。数据的独立性包括数据的物理独立性和数据的逻辑独立性。
WEB数据库的环境由硬件元素和软件元素组成。硬件元素包括WEB服务器、客户机、数据库服务器、网络。软件元素包括客户端必须有能够解释执行HTML代码的浏览器。
WEB服务器必须具有能执行可以自动生成HTML代码的程序的功能,具有能自动完成数据操作指令的数据库系统。
4 关系数据库与关系运算
笛卡尔积与关系
定义1 设D1,D2,D3,…, Dn为任意集合,定义D1,D2,D3,…, Dn的笛卡尔积为
D1 * D2 * D3 * … * Dn = {(d1, d2, d3, …, dn) | di ∈ Di,i= 1, 2, 3,…,n}
其中每一个元素(d1, d2, d3, …, dn)叫做一个n 元组( |
|
00oo.. 发表于 2005/10/23 15:29:44
|
|