大家好,欢迎来到第1周的SQL Server性能调优培训。在我们进入SQL Server性能调优里枯燥难懂的细节内容之前,我想通过讲解SQL Server如何执行一个查询来建立基础。这个部分非常重要,因为接下来的培训中我们会以这些概念来加深我们对SQL Server的认识。
当我们执行一个查询时,在SQL Server中最重要的组件有哪些,下面这张图片可以给大家一个概观的认识。
可以看到,SQL Server内部分成了2个部分:关系引擎和存储引擎。在关系引擎中最大的一个组件是查询优化器。查询优化器唯一和仅有的任务是把我们传入的查询语句生成实际的执行计划。
读取数据
我们提交给SQL Server 的查询,通过协议层传给命令分析器。命令分析器会检查我们是否提供了一个语法正确的语句,我们所提到的表和列在数据库里是否存在。命令分析器会生成可以重现我们查询的查询树。查询树会被查询优化器用来生成执行计划。
然后编译后的执行计划会提交给查询执行器。查询执行器的任务是执行执行计划。但是为了以后的重用,首先它会把编译好的执行计划放在执行计划缓存区进行缓存。在SQL Server 中计划缓存是个强大同时又是一个非常危险的概念。我们会在第10周讨论计划缓存的时学到更多的细节。
执行计划被缓存后,查询执行器与存储引擎进行互动,并在执行计划里执行每个操作。当我们在执行计划里访问数据时,存取方法会向缓冲区管理器读取我们想要指定页。下周我们将讨论SQL Server中页的更多细节。现在你只要知道页是8Kb的缓存,在那里存放着我们的表和索引数据。缓冲管理器管理着缓冲池(缓冲池包含执行计划缓存区和数据缓存区),那里存放着我们8kb大小的页。缓冲池是SQL Server的主要内存消耗,它的大小我们可以通过服务器属性->内存->最小、最大服务器内存(MB)来配置。
当请求的页面已经被存在缓冲池时,页会被立即读取。在SQL Server里这个被称为逻辑读。如果请求的页没存在缓冲池,缓冲区管理器会发起异步I/O操作把请求的页从我们的存储子系统中读到缓冲池,这个被称为物理读。在异步I/O操作期间,我们的查询需要一直等到操作结束才继续。在第22周我们会讨论等待和等待统计的更多细节。
一旦页被读取到缓冲池,页会被请求的访问方法取走。当执行计划执行完成后,产生的数据会通过协议层返回给提交查询的程序。
修改数据
当我们与使用修改数据的TSQL语句(INSERT,UPDATE,DELETE,MERGE)打交道时,存储引擎同样与事务管理器进行交互。事务管理器把执行事务中描述我们所做的改变通过事务日志写到事务文件。当这些日志记录写好后,事务就可以提交了。事务执行有多快,你的数据修改就有多快。
在内存中被修改的页通过称为检查点过程写回存储子系统。默认情况下,检查点每一分钟从缓冲区管理器请求所有的脏页并执行一次。脏页就是在内存里被修改,但还没有写回存储的。一旦脏页被写回存储,这个页就会被标记为干净页。
小结
从上面的描述我们可以看到,当你执行一个SQL语句查询时,SQL Server里面发生了很多不同的事情。如果你想了解更多SQL Server里各个组件间的相互操作,我强烈推荐看下SQL Server团队成员Remus Rusanu这个帖子。(注中文版:)
上面提到的各个组件如果出现问题,都会触发SQL Server的性能问题,这些问题最后都要靠你来解决。下周我们见到的时候,将一起讨论下SQL Server中的页。