小说阅读网站,盗墓笔记小说下载

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案

SQL性能第2篇：查詢分析和訪問路徑制定

女主宣言

創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù)，包含不限于網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作、鶴山網(wǎng)絡(luò)推廣、小程序設(shè)計(jì)、鶴山網(wǎng)絡(luò)營(yíng)銷、鶴山企業(yè)策劃、鶴山品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運(yùn)營(yíng)等，從售前售中售后，我們都將竭誠(chéng)為您服務(wù)，您的肯定，是我們最大的嘉獎(jiǎng)；創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供鶴山建站搭建服務(wù)，24小時(shí)服務(wù)熱線：13518219792，官方網(wǎng)址：www.cdcxhl.com

在SQL性能概述的第一部分中，我們研究了關(guān)系優(yōu)化及其影響因素。在今天的文章中，我們將注意力轉(zhuǎn)向查詢分析以及SQL轉(zhuǎn)換為可執(zhí)行代碼的方式。希望對(duì)大家在SQL性能優(yōu)化方面有所幫助。

在SQL性能概述的第一部分中，我們研究了關(guān)系優(yōu)化及其影響因素。在今天的文章中，我們將注意力轉(zhuǎn)向查詢分析以及SQL轉(zhuǎn)換為可執(zhí)行代碼的方式。

從上層看，優(yōu)化過程包括四個(gè)步驟：

接收并驗(yàn)證SQL語(yǔ)句。
分析環(huán)境，優(yōu)化滿足SQL語(yǔ)句的方法。
創(chuàng)建機(jī)器可讀的指令來(lái)執(zhí)行優(yōu)化的SQL。
執(zhí)行這些指令或?qū)⑺鼈兇鎯?chǔ)起來(lái)以備將來(lái)執(zhí)行。

需要做的第一件事是驗(yàn)證SQL是否寫對(duì)了。這并不意味著它會(huì)做你希望它做的事情，只是它符合所需的語(yǔ)法。將對(duì)SQL進(jìn)行分析和檢查。如果遇到任何錯(cuò)誤，進(jìn)程將停止，你必須修改SQL，直到它正確為止。在驗(yàn)證SQL語(yǔ)法之后，下一步是檢查語(yǔ)義，例如數(shù)據(jù)類型、引用約束、檢查約束、視圖和觸發(fā)器。

這個(gè)過程的第二步是最有趣的。優(yōu)化器如何決定如何執(zhí)行可以按其方式發(fā)送的大量SQL語(yǔ)句？此查詢分析步驟掃描SQL以確定其總體復(fù)雜性。SQL語(yǔ)句的表達(dá)式是決定優(yōu)化器選擇的訪問路徑的一個(gè)重要因素。查詢的復(fù)雜性、謂詞的數(shù)量和類型、函數(shù)的存在以及排序子句的存在都將進(jìn)入優(yōu)化器計(jì)算的估計(jì)成本中。

SQL語(yǔ)句越復(fù)雜，查詢分析就必須做越多的工作來(lái)理解SQL語(yǔ)句。在查詢分析期間，優(yōu)化器分析SQL語(yǔ)句和數(shù)據(jù)庫(kù)系統(tǒng)的各個(gè)方面，例如

需要哪些數(shù)據(jù)庫(kù)中的哪些表
是否需要將任何視圖分解為基礎(chǔ)表
是否需要表連接或子選擇
是否需要UNION、EXCEPT或INTERSECT
可以使用哪些索引(如果有的話)
必須滿足多少謂詞(WHERE子句)
必須執(zhí)行哪些函數(shù)
SQL是否使用OR或AND
DBMS如何處理SQL語(yǔ)句的每個(gè)組件
為SQL語(yǔ)句中的表使用的數(shù)據(jù)緩存分配了多少內(nèi)存
如果查詢需要排序，有多少內(nèi)存可用于排序

換句話說(shuō)，查詢分析將SQL語(yǔ)句分解為必須執(zhí)行的離散任務(wù)，以返回查詢結(jié)果。

現(xiàn)代關(guān)系優(yōu)化器是基于成本的，這意味著優(yōu)化過程總是試圖為每個(gè)查詢制定一個(gè)降低總體成本的訪問路徑。為了實(shí)現(xiàn)這一點(diǎn)，優(yōu)化器應(yīng)用查詢成本公式來(lái)評(píng)估和權(quán)衡每個(gè)潛在訪問路徑的多個(gè)因素：這些因素包括CPU成本、I/O操作、系統(tǒng)編目中的統(tǒng)計(jì)信息以及實(shí)際的SQL語(yǔ)句代碼。

優(yōu)化器可以重寫查詢，將其轉(zhuǎn)換為等效的、但更容易編譯和優(yōu)化的版本。謂詞下推和轉(zhuǎn)換可能在此時(shí)發(fā)生。然后優(yōu)化SQL。將審查和分析多條訪問路徑，以選擇成本最低的選項(xiàng)。最后一步是創(chuàng)建實(shí)際的可執(zhí)行代碼。

訪問路徑

關(guān)系優(yōu)化器有許多創(chuàng)建SQL訪問路徑的選項(xiàng)。在較高的層次上，有訪問單個(gè)表中的數(shù)據(jù)的方法，也有組合兩個(gè)表中的數(shù)據(jù)的方法?？梢詫⑦@些方法組合成一系列訪問方法，為SQL語(yǔ)句創(chuàng)建總體訪問路徑。

對(duì)于單表訪問，可以使用掃描或索引檢索數(shù)據(jù)。在優(yōu)化器確定每個(gè)謂詞可用的索引之后，它將決定是使用單個(gè)索引、多個(gè)索引還是根本不使用索引。

大家很容易說(shuō)索引訪問將優(yōu)于掃描訪問，但事實(shí)并非總是如此。優(yōu)化器必須評(píng)估必須訪問的數(shù)據(jù)量以及查詢的性質(zhì)。例如，如果你正在創(chuàng)建一個(gè)包含表中每一行的報(bào)告，那么使用索引可能比使用掃描讀取所有數(shù)據(jù)要慢。

表掃描是最簡(jiǎn)單的數(shù)據(jù)訪問形式。表掃描是通過讀取表的每一行來(lái)執(zhí)行的。根據(jù)DBMS的不同，可能存在另一種掃描類型，稱為表空間掃描。表空間掃描讀取表空間中的每個(gè)頁(yè)面，表空間可能包含多個(gè)表。顯然，表空間掃描將比表掃描運(yùn)行得慢，因?yàn)榭赡軙?huì)產(chǎn)生額外的I/O讀取不適用的數(shù)據(jù)。

另一種掃描形式是分區(qū)掃描。如果DBMS能夠確定要訪問的數(shù)據(jù)存在于多分區(qū)表（或表空間）的某些分區(qū)中，那么它可以將掃描到的數(shù)據(jù)限制到適當(dāng)?shù)姆謪^(qū)。分區(qū)掃描應(yīng)該優(yōu)于表掃描或表空間掃描，因?yàn)樗璧腎/O數(shù)量減少了。

通常，優(yōu)化器會(huì)選擇掃描數(shù)據(jù)，原因如下之一：

使用索引無(wú)法滿足查詢，可能是因?yàn)闆]有索引可用、謂詞與索引不匹配，或者謂詞妨礙索引的使用。
表中的行符合條件的百分比很高。在這種情況下，使用索引可能效率較低，因?yàn)闊o(wú)論如何都需要讀取大多數(shù)數(shù)據(jù)行。
具有匹配謂詞的索引具有較低的集群比率，并且僅對(duì)少量數(shù)據(jù)有效。
表太小，使用索引實(shí)際上是有害的。對(duì)于小表，向表訪問添加索引訪問可能會(huì)導(dǎo)致額外的I/O，而不是更少的I/O。

為了幫助掃描的性能，優(yōu)化器可以調(diào)用數(shù)據(jù)預(yù)取。數(shù)據(jù)預(yù)取會(huì)導(dǎo)致DBMS在請(qǐng)求數(shù)據(jù)頁(yè)之前，按順序?qū)?shù)據(jù)頁(yè)讀入數(shù)據(jù)緩存。從本質(zhì)上說(shuō)，數(shù)據(jù)預(yù)取是一種讀前機(jī)制——當(dāng)數(shù)據(jù)掃描開始請(qǐng)求數(shù)據(jù)時(shí)，它已經(jīng)存在于內(nèi)存中。Prefetch對(duì)于掃描特別有用，但是對(duì)于任何類型的順序數(shù)據(jù)訪問都是實(shí)用的。你應(yīng)該了解特定DBMS如何以及為什么預(yù)取數(shù)據(jù)。

索引存取

大多數(shù)的訪問應(yīng)該使用索引，這使我們可以選擇掃描或索引訪問。優(yōu)化器必須首先發(fā)現(xiàn)是否存在索引。在編寫SQL來(lái)訪問列之前，不必定義索引—你可以查詢數(shù)據(jù)庫(kù)所知道的任何表的任何列。

此外，必須在SQL語(yǔ)句中的可索引謂詞中引用至少一個(gè)索引列。DBMS不能為每個(gè)WHERE子句使用索引。您必須了解謂詞可以使用哪些類型的索引來(lái)確保為數(shù)據(jù)庫(kù)應(yīng)用程序中的查詢創(chuàng)建適當(dāng)?shù)乃饕?。每個(gè)數(shù)據(jù)庫(kù)管理系統(tǒng)都有一個(gè)不同的列表，其中列出了什么是可索引的，什么是不可索引的。此外，可索引的內(nèi)容往往會(huì)隨著每個(gè)DBMS的版本而變化。

優(yōu)化器可以選擇以許多不同的方式使用索引。第一個(gè)也是最簡(jiǎn)單的索引訪問類型是直接索引查找。為了使DBMS能夠執(zhí)行直接索引查找，必須為索引中的每一列提供值。為了執(zhí)行直接索引查找，DBMS將謂詞中請(qǐng)求的值與索引根頁(yè)中存儲(chǔ)的值進(jìn)行比較?；谶@種比較，DBMS將把索引遍歷到下一個(gè)頁(yè)面集。如果存在中間的非葉頁(yè)，則讀取適當(dāng)?shù)姆侨~頁(yè)，并比較該值以確定要訪問哪個(gè)葉頁(yè)。閱讀適當(dāng)?shù)捻?yè)；索引頁(yè)包含指向符合條件的行實(shí)際數(shù)據(jù)的指針?；陧?yè)索引條目中的指針，DBMS讀取適當(dāng)?shù)谋頂?shù)據(jù)頁(yè)。

但是，假設(shè)SQL語(yǔ)句中沒有提供索引的所有列。不能選擇直接索引查找，因?yàn)镈BMS不能匹配完整的索引鍵。相反，可以選擇索引掃描。當(dāng)一個(gè)索引掃描被調(diào)用時(shí)，索引的頁(yè)被依次讀取。

索引掃描有兩種基本類型：匹配索引掃描和不匹配索引掃描。匹配的索引掃描有時(shí)稱為絕對(duì)定位。匹配的索引掃描從索引的根頁(yè)開始，以與直接索引查找相同的方式向下工作到葉頁(yè)。但是，由于索引的完整鍵不可用，DBMS必須掃描索引的頁(yè)，查找可用的值，直到檢索到所有匹配的值。

要使用匹配的索引掃描，必須在索引鍵中指定高階列;即索引DDL中指定的第一列。高階列為DBMS從根頁(yè)面到適當(dāng)?shù)娜~頁(yè)面遍歷索引結(jié)構(gòu)提供了起點(diǎn)。

請(qǐng)考慮在查詢中不指定高階列的后果。DBMS可以部署不匹配的索引掃描，有時(shí)稱為相對(duì)定位。當(dāng)由于索引鍵中的第一列未指定而無(wú)法確定起始點(diǎn)時(shí)，DBMS不能使用索引樹結(jié)構(gòu)。但是，它可以掃描索引頁(yè)。不匹配的索引掃描從索引中的第一個(gè)頁(yè)開始，然后應(yīng)用可用的謂詞順序掃描后續(xù)的頁(yè)。

不匹配的索引掃描可能比表或表空間掃描更有效，特別是如果必須訪問的數(shù)據(jù)頁(yè)是按集群順序進(jìn)行的。此外，請(qǐng)記住索引頁(yè)(或塊)包含的條目比表頁(yè)多，因?yàn)樗饕靶小北缺硇卸蹋瑥亩顾饕?yè)I/O比掃描表頁(yè)更有效。

總結(jié)

在本篇中，我們從較高的層次上研究了查詢分析和訪問路徑公式，了解了查詢分析的組件和單表訪問方法。但還有更多的東西需要學(xué)習(xí)。在下一期文章中，我們將研究關(guān)系優(yōu)化可以使用的多表訪問方法。希望對(duì)大家在SQL性能優(yōu)化方面有所幫助。

HULK一線技術(shù)雜談

由360云平臺(tái)團(tuán)隊(duì)打造的技術(shù)分享公眾號(hào)，內(nèi)容涉及云計(jì)算、數(shù)據(jù)庫(kù)、大數(shù)據(jù)、監(jiān)控、泛前端、自動(dòng)化測(cè)試等眾多技術(shù)領(lǐng)域，通過夯實(shí)的技術(shù)積累和豐富的一線實(shí)戰(zhàn)經(jīng)驗(yàn)，為你帶來(lái)最有料的技術(shù)分享

網(wǎng)頁(yè)標(biāo)題：SQL性能第2篇：查詢分析和訪問路徑制定
文章網(wǎng)址：http://fisionsoft.com.cn/article/pgiisd.html

新聞中心

其他資訊