在关系资料库中,索引是一种单独的、物理的对资料库表中一列或多列的值进行排序的一种存储结构,它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。
索引提供指向存储在表的指定列中的数据值的指针,然后根据您指定的排序顺序对这些指针排序。资料库使用索引以找到特定值,然后顺指针找到包含该值的行。这样可以使对应于表的SQL语句执行得更快,可快速访问资料库表中的特定信息。
当表中有大量记录时,若要对表进行查询,第一种搜寻信息方式是全表搜寻,是将所有记录一一取出,和查询条件进行一一对比,然后返回满足条件的记录,这样做会消耗大量资料库系统时间,并造成大量磁碟I/O操作;第二种就是在表中建立索引,然后在索引中找到符合查询条件的索引值,最后通过保存在索引中的ROWID(相当于页码)快速找到表中对应的记录。
基本介绍 中文名 :索引 外文名 :index 分类 :资料库概念 作用 :应于表的SQL语句执行得更快 发展历史,定义概念,作用,优缺点,优点,缺点,索引类型,普通索引,唯一索引,主键索引,候选索引,聚集索引,非聚集索引,操纵索引,维护和使用,创建索引,修改索引,删除索引,注意事项, 发展历史 旧称通检、备检或引得。组成的基本单位是索引款目。款目一般包括索引词、说明或注释语 、出处3项内容 。所有索引款目实现有序化编排。其本质特征是只揭示内容出处或文献线索 ,并不直接提供事实、资料本身。主要功能是为人们准确、迅速地获得文献资料提供线索性指引。常见的索引主要有报刊论文资料索引、文集篇目索引、语词索引、文句索引、关键字索引、专名索引、主题索引等。 索引最早出现于西方,主要是中世纪欧洲宗教著作的索引。18世纪以后西方开始有主题索引,至19世纪末,内容分析索引被广泛使用。中国的索引出现较晚。一般认为,明末傅山所编的《两汉书姓名韵》是现存最早的人名索引。清代乾嘉时期,章学诚曾力倡编纂群书综合索引。20世纪20年代,随着西方索引理论与编制技术的传入,中国现代意义上的索引编制与研究才蓬勃展开 。1930年钱亚新发表《索引和索引法》,1932年洪业发表《引得说》,标志著具有中国特色的现代索引理论、技术已迅速发展起来。20世纪50年代,计算机技术被运用于索引编制 。此后,机编索引的大量出现,使索引编制理论、技术、索引载体形式发生了深刻变革。 目前SQL标准中没有涉及索引,但商用关系资料库管理系统一般都支持索引机制,只是不同的关系资料库管理系统支持的索引类型不尽相同。 索引已经成为关系资料库非常重要的部分。它们被用作包含所关心数据的表指针。通过一个索引,能从表中直接找到一个特定的记录,而不必连续顺序扫描这个表,一次一个地去查找。对于大的表,索引是必要的。没有索引,要想得到一个结果要等好几个小时、好几天,而不是几秒钟。 定义概念 索引是为了加速对表中数据行的检索而创建的一种分散的存储结构。索引是针对表而建立的,它是由数据页面以外的索引页面组成的,每个索引页面中的行都会含有逻辑指针,以便加速检索物理数据。 在资料库关系图中,可以在选定表的“索引/键”属性页中创建、编辑或删除每个索引类型。当保存索引所附加到的表,或保存该表所在的关系图时,索引将保存在资料库中。 作用 在资料库系统中建立索引主要有以下作用: (1)快速取数据; (2)保证数据记录的唯一性; (3)实现表与表之间的参照完整性; (4)在使用ORDER by、group by子句进行数据检索时,利用索引可以减少排序和分组的时间。 优缺点 优点 1.大大加快数据的检索速度; 2.创建唯一性索引,保证资料库表中每一行数据的唯一性; 3.加速表和表之间的连线; 4.在使用分组和排序子句进行数据检索时,可以显著减少查询中分组和排序的时间。 缺点 1.索引需要占物理空间。 2.当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,降低了数据的维护速度。 索引类型 根据资料库的功能,可以在资料库设计器中创建四种索引:普通索引、唯一索引、主键索引和聚集索引。 普通索引 最基本的索引类型,没有唯一性之类的限制。普通索引可以通过以下几种方式创建: 创建索引,例如CREATE INDEX <索引的名字> ON tablename (列的列表); 修改表,例如ALTER TABLE tablename ADD INDEX [索引的名字] (列的列表); 创建表的时候指定索引,例如CREATE TABLE tablename ( [...], INDEX [索引的名字] (列的列表) ); 唯一索引 唯一索引是不允许其中任何两行具有相同索引值的索引。 当现有数据中存在重复的键值时,大多数资料库不允许将新创建的唯一索引与表一起保存。资料库还可能防止添加将在表中创建重复键值的新数据。例如,如果在 employee 表中职员的姓 (lname) 上创建了唯一索引,则任何两个员工都不能同姓。 对某个列建立UNIQUE索引后,插入新记录时,资料库管理系统会自动检查新纪录在该列上是否取了重复值,在CREATE TABLE 命令中的UNIQE约束将隐式创建UNIQUE索引。 创建唯一索引的几种方式: 创建索引,例如CREATE UNIQUE INDEX <索引的名字> ON tablename (列的列表); 修改表,例如ALTER TABLE tablename ADD UNIQUE [索引的名字] (列的列表); ; 创建表的时候指定索引,例如CREATE TABLE tablename ( [...], UNIQUE [索引的名字] (列的列表) ); 主键索引 简称为主索引,资料库表中一列或列组合(栏位)的值唯一标识表中的每一行。该列称为表的主键。 在资料库关系图中为表定义主键将自动创建主键索引,主键索引是唯一索引的特定类型。该索引要求主键中的每个值都唯一。当在查询中使用主键索引时,它还允许对数据的快速访问。 提示尽管唯一索引有助于定位信息,但为获得最佳性能结果,建议改用主键索引。 候选索引 与主索引一样要求栏位值的唯一性,并决定了处理记录的顺序。在资料库和自由表中,可以为每个表建立多个候选索引。 聚集索引 也称为聚簇索引,在聚集索引中,表中行的物理顺序与键值的逻辑(索引)顺序相同。一个表只能包含一个聚集索引, 即如果存在聚集索引,就不能再指定CLUSTERED 关键字。 索引不是聚集索引,则表中行的物理顺序与键值的逻辑顺序不匹配。与非聚集索引相比,聚集索引通常提供更快的数据访问速度。聚集索引更适用于对很少对基表进行增删改操作的情况。 如果在表中创建了主键约束,SQL Server将自动为其产生唯一性约束。在创建主键约束时,指定了CLUSTERED关键字或干脆没有制定该关键字,SQL Sever将会自动为表生成唯一聚集索引。 非聚集索引 也叫非簇索引,在非聚集索引中,资料库表中记录的物理顺序与索引顺序可以不相同。一个表中只能有一个聚集索引,但表中的每一列都可以有自己的非聚集索引。如果在表中创建了主键约束,SQL Server将自动为其产生唯一性约束。在创建主键约束时,如果制定CLUSTERED关键字,则将为表产生唯一聚集索引。 操纵索引 维护和使用 DBMS自动完成维护和自动选择是否使用索引以及使用哪些索引。 创建索引 SQL3没有提供建立索引的方法。但是,从事DBMS开发、销售的公司都提供他们具有这种功能的SQL工具。因为这些工具不是标准化的,它们相互不同。SQL语言使用CREATE INDEX 语句建立索引,其一般格式是: CREATE [UNIQUE] [CLUSTERED| NONCLUSTERED] INDEX <索引名> ON <表名>(<列名>[ASC|DESC] [, <列名>[ASC|DESC]...]) 说明:与表一样,索引也需要有唯一的名字,且基于一个表来建立,可以根据表中的一列或者多列,当列的顺序都是升序默认可不必标出,当属性列有按照降序排列的,所有属性的升序降序都不要标明。 UNIQUE——建立唯一索引。 CLUSTERED——建立聚集索引。 NONCLUSTERED——建立非聚集索引。 ASC——索引升序排序。 DESC——索引降序排序。 修改索引 对于已经建立的索引,如果需要对其重新命名,可以使用ALTER INDEX 语句。其一般格式为 ALTER INDEX <旧引索名字> RENAME TO<新引索名> 删除索引 当某个时期基本表中数据更新频繁或者某个索引不再需要时,需要删除部分索引。SQL语言使用DROP INDEX 语句删除索引,其一般格式是: DROP INDEX<索引名> 删除索引时,DBMS不仅在物理删除相关的索引数据,也会从数据字典删除有关该索引的描述。 注意事项 并非所有的资料库都以相同的方式使用索引。作为通用规则,只有当经常查询索引列中的数据时,才需要在表上创建索引。索引占用磁碟空间,并且降低添加、删除和更新行的速度。如果应用程式非常频繁地更新数据或磁碟空间有限,则可能需要限制索引的数量。在表较大时再建立索引,表中的数据越多,索引的优越性越明显。 可以基于资料库表中的单列或多列创建索引。多列索引使您可以区分其中一列可能有相同值的行。 如果经常同时搜寻两列或多列或按两列或多列排序时,索引也很有帮助。例如,如果经常在同一查询中为姓和名两列设定判据,那么在这两列上创建多列索引将很有意义。 确定索引的有效性: 检查查询的 WHERE 和 JOIN 子句。在任一子句中包括的每一列都是索引可以选择的对象。 对新索引进行试验以检查它对运行查询性能的影响。 考虑已在表上创建的索引数量。最好避免在单个表上有很多索引。 检查已在表上创建的索引的定义。最好避免包含***享列的重叠索引。 检查某列中唯一数据值的数量,并将该数量与表中的行数进行比较。比较的结果就是该列的可选择性,这有助于确定该列是否适合建立索引,如果适合,确定索引的类型。