• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 297,  comments - 15,  trackbacks - 0
            Dejan Bosanac是一個軟件開發(fā)者,技術(shù)顧問和作家。他關(guān)注不同技術(shù)的集成和互操作,尤其是與Java以及Web開發(fā)相關(guān)的領(lǐng)域。

            數(shù)據(jù)庫在操作少量測試數(shù)據(jù)和大量數(shù)據(jù)的時候,表現(xiàn)行為上有很大的差異。通常,在開發(fā)過程前期,人們不會關(guān)注數(shù)據(jù)庫性能的問題,但是隨著時間的發(fā)展,人們必須采取一些措施來保證數(shù)據(jù)庫在大量數(shù)據(jù)的情況下正常工作。

            Derby這個完全Java開發(fā)的開源的數(shù)據(jù)庫也不例外,因此你必須保證它不會成為你程序的一個瓶頸。盡管人們可以在Derby的手冊中找到關(guān)于這 個話題全面的資料,我還是想更詳盡的關(guān)注一下這些問題,基于我的經(jīng)驗提供一些具體的例子。本文將著重于那些由在大的數(shù)據(jù)表中選擇查詢數(shù)據(jù)而產(chǎn)生的程序性能 問題。

            首先,有很多關(guān)于調(diào)整Derby屬性(諸如頁面大小和緩存大小等)的技巧。修改這些參數(shù)可以在一定程度上調(diào)整數(shù)據(jù)庫的性能,但是在通常情況下,更主要的問題來自與你的程序和數(shù)據(jù)庫的設(shè)計,因此,我們必須首先關(guān)注這些問題,最后再來考慮Derby的屬性。

            在接下來的段落里,我將介紹一些能夠優(yōu)化程序中有問題部分的技術(shù)。但是,和其他性能優(yōu)化操作一樣,我們需要在優(yōu)化前先測量并確認問題所在。

            一個簡單的例子

            讓我們從一個簡單的例子開始:假設(shè)我們Web程序中擁有一個“search/list”的頁面,要處理一個有接近100,000行的表,并且那個表 不是很小的(至少有10欄)。用簡單的JDBC來寫一個例子,這樣我們可以專注在數(shù)據(jù)庫和JDBC問題上來。這篇文章中介紹的所有準則對所有的面向?qū)ο蟮?映射工具都適用。

            為了使得用戶能夠列出一個大的表,通常使用下面簡單的查詢語句。 select * from tbl


            對應(yīng)的JDBC語句如下:Class.forName("org.apache.derby.jdbc.ClientDriver").newInstance();
            Connection connection = DriverManager.getConnection (
            "jdbc:derby://localhost:1527/testDb;");
            Statement stmt = connection.createStatement();
            ResultSet rs = stmt.executeQuery("select * from tbl");
            ArrayList allResults = new ArrayList();
            while (rs.next()) {
            // Object-Relation mapping code to populate your
            // object from result set row
            DomainObject domainObject = populate(rs);
            allResults.add(modelObject);
            }
            System.out.println("Results Size: " + allResults.size());


            在這兒,我們碰到了第一個問題。執(zhí)行這樣的代碼,并產(chǎn)生100,000(或更多)個domain對象將肯定會導(dǎo)致java用完堆??臻g,產(chǎn)生一個 “java.lang.OutOfMemoryError”的錯誤。對于初學(xué)者來說,我們首先必須找到一個方法來使得這個程序工作。

            分頁Result Sets

            隨著程序中數(shù)據(jù)量的增多,你首先想到的應(yīng)該做的事就是為特定的記錄(通常是視圖)提供分頁支持。正如你在這個介紹性的例子中看到的,簡單地去獲取龐大的result sets很容易導(dǎo)致 out of memory的錯誤。

            許多數(shù)據(jù)庫服務(wù)器支持特定的SQL結(jié)構(gòu),它們可以用于獲得一個查詢結(jié)果的特定的子集。例如,在MySQL中,提供了LIMIT和OFFSET關(guān)鍵字,它們可以用于select查詢。因此,如果你執(zhí)行類似下面的查詢:select * from tbl LIMIT 50 OFFSET 100 


            你的結(jié)果集將包含從第100個結(jié)果開始的50行,即使原先的查詢返回了100,000行。許多其他的數(shù)據(jù)庫提供商通過不同的結(jié)構(gòu)提供了相似的功能。 不幸的是,Derby并沒有提供這樣的功能,所以你必須繼續(xù)使用原先的“select * from tbl”查詢語句,然后在應(yīng)用程序中實現(xiàn)一個分頁的機制。讓我們來看下面的例子:Class.forName("org.apache.derby.jdbc.ClientDriver").newInstance();
            Connection connection = DriverManager.getConnection(
            "jdbc:derby://localhost:1527/testDb;");
            Statement stmt = connection.createStatement();
            ResultSet rs = stmt.executeQuery("SELECT * FROM tbl");
            ArrayList allResults = new ArrayList();
            int i = 0;
            while (rs.next()) {
            if (i > 50 && i <= 100) {
            // O-R mapping code populate your row from result set
            DomainObject domainObject = populate(rs);
            allResults.add(modelObject);
            }
            i++;
            }
            System.out.println("Results Size: " + allResults.size());


            通過這些額外的語句,我們提供了“分頁”的功能。盡管所有的結(jié)果都從數(shù)據(jù)庫服務(wù)器中取出了,但是只有那些我們感興趣的行才真正的映射到了Java的 對象中?,F(xiàn)在我們避免了先前碰到的“OutOfMemoryError”的問題了,這樣保證了我們的程序可以真正的工作在大的數(shù)據(jù)表上。

            然而,通過這個解決方案,數(shù)據(jù)庫仍然會掃描整個表,然后返回所有的行,這還是一個非常消耗時間的任務(wù)。對于我的事例數(shù)據(jù)庫來說,這個操作的執(zhí)行要花費10秒鐘,這在程序中顯然是不可接受的。

            因此,我們必須給出一個解決方案;我們并不需要返回所有的數(shù)據(jù)庫行,而只需要那些我們感興趣的(或者至少是所有行的最小可能子集)。我們這兒使用的 技巧就是顯式的告訴JDBC驅(qū)動我們需要多少行。我們可以使用java.sql.Statement接口提供的setMaxRows()函數(shù)來完成這個任 務(wù)??聪旅娴睦樱篊lass.forName("org.apache.derby.jdbc.ClientDriver").newInstance();
            Connection connection = DriverManager.getConnection(
            "jdbc:derby://localhost:1527/testDb;");
            Statement stmt = connection.createStatement();
            stmt.setMaxRows(101);
            ResultSet rs = stmt.executeQuery("SELECT * FROM tbl");
            ArrayList allResults = new ArrayList();
            int i = 0;
            while (rs.next()) {
            if (i > 50 && i <= 100) {
            // O-R mapping code populate your row from result set
            DomainObject domainObject = populate(rs);
            allResults.add(modelObject);
            }
            }
            System.out.println("Results Size: " + allResults.size());


            值得注意的是,我們把最大行的值設(shè)置為了我們需要的最后一行(增加了1)。因此,通過這樣的解決方案,我們不是僅僅取得了我們想要的50行,而是先 獲取了100行,然后從中篩選出我們感興趣的50行。不幸的是,我們沒有辦法告訴JDBC驅(qū)動從一個具體的行開始,因此我們必須說明要顯示的記錄的最大行 數(shù)。這就意味著返回最初的一些記錄的操作的性能是很好的,但是隨著用戶瀏覽的結(jié)果的增多,性能也會下降。好消息就是在大多數(shù)的情形下,用戶不會瀏覽的太多 的記錄,他們會在前幾條記錄重獲得他們尋找的行,或者改變查詢策略。在我本人的環(huán)境中,上述的例子的執(zhí)行時間從8秒降到了0.8秒。

            這是一個描述如何瀏覽整個表的簡單的例子。但是當查詢語句中增加了特定的where條件和排序信息時,事情又開始變化了。在接下來的部分里,我將解釋為什么這種情況會發(fā)生,以后我們?nèi)绾伪WC在那些例子中獲得可接受的性能。
            確保使用索引(避免全表掃描)

            索引在數(shù)據(jù)庫設(shè)計中是一個非常重要的概念。因為本文所涉及的范圍有限,我并不會詳細的介紹索引理論。簡單來說,索引是特定的數(shù)據(jù)庫結(jié)構(gòu),能夠允許對 表中的行進行快速訪問。索引通常是在一欄或多欄上創(chuàng)建的,因為他們比整個表小了很多,他們的主要用處就是快速搜索一欄(多欄)中的值。

            Derby自動的為主鍵和外鍵的欄以及具有唯一性限制的欄創(chuàng)建索引。對于其他任何欄,我們必須顯式的創(chuàng)建索引。在接下來的段落中,我們將研究一些例子來介紹索引在什么時候有用以及為什么有用。

            但是首先,我們必須做一些準備。在我們開始優(yōu)化之前,我們需要能夠了解我們執(zhí)行查詢操作的時候數(shù)據(jù)庫中發(fā)生了什么。Derby提供了 derby.language.logQueryPlan這個參數(shù)。如果設(shè)置了這個參數(shù),Derby將會把所有執(zhí)行的查詢的查詢計劃(query plan)記錄在derby.log這個文件中(這個文件在derby.system.home文件夾中)。我們可以在啟動服務(wù)器之前通過合適的 derby.properties文件或者執(zhí)行如下的java語句來設(shè)置該參數(shù)。 System.setProperty("derby.language.logQueryPlan", "true");


            通過檢查查詢計劃,我們可以觀察Derby在查詢中是使用了索引還是進行了全表查詢,全表查詢是一個很耗時間的操作。

            既然我們已經(jīng)設(shè)置好了環(huán)境,我們可以開始我們的例子了。假設(shè)我們先前使用的表 tb1中有一個沒有索引的欄叫做owner。因為對查詢結(jié)果的排序通常是查詢性能低下的主要原因,我將介紹所有與排序有關(guān)的優(yōu)化?,F(xiàn)在,如果我們希望修改 先前的例子來根據(jù)這一欄的值來排序我們的結(jié)果,我們需要把我們的查詢語句改成如下的樣子: SELECT * FROM tbl ORDER BY owner


            如果我們用這個查詢語句代替先前的語句,執(zhí)行的時間將是先前的好多倍。盡管我們分頁(paginated)了所有的結(jié)果,并小心的設(shè)置了要獲取的行數(shù),總的執(zhí)行時間將會是8秒。

            如果我們查看derby.log文件中查詢執(zhí)行計劃,我們可以輕易的發(fā)現(xiàn)問題:Table Scan ResultSet for TBL at read committed isolation
            level using instantaneous share row locking chosen
            by the optimizer


            這意味著Derby為了將記錄排序,是在整個表中執(zhí)行了查找這個操作。那我們可以做些什么來改善這個情況呢?答案很簡單,在這一欄上創(chuàng)建一個索引。我們可以通過如下的SQL語句來做這件事: CREATE INDEX tbl_owner ON tbl(owner)


            如果我們重復(fù)我們先前的例子,我們將得到一個和我們沒有做排序前的那個例子相似的結(jié)果(在我的機器上是不到1秒)。

            同樣,如果你現(xiàn)在查詢derby.log,你將看到下面的信息(而不是和上面的一樣的):Index Scan ResultSet for TBL using index TBL_OWNER
            at read committed isolation level using share row locking
            chosen by the optimizer


            這就意味著我們可以確保Derby使用了剛創(chuàng)建的索引來獲取合適的行。

            使用合適的索引順序

            我們已經(jīng)看到了索引是如何幫助我們改善了排序某一欄數(shù)據(jù)時的性能。但是如果我們嘗試去反轉(zhuǎn)排序的順序的時候會發(fā)生什么呢?假設(shè)我們希望根據(jù)owner欄降序分類我們的數(shù)據(jù)。在這種情況下,我們原先的查詢就會變成如下的語句: SELECT * FROM tbl ORDER BY owner DESC


            注意,我們增加了DESC這個關(guān)鍵字,該關(guān)鍵字將按降序來排序我們的結(jié)果。如果我們執(zhí)行這個新修改過的查詢語句,將會發(fā)現(xiàn)整個執(zhí)行的時間又增加到先前的8-9秒。并且,在日志文件中,你將會發(fā)現(xiàn)又是執(zhí)行了全表掃描。

            解決的方法就是為這一欄創(chuàng)建一個降序的索引。對于我們的owner欄,我們執(zhí)行如下的SQL語句。 CREATE INDEX tbl_owner_desc ON tbl(owner desc)


            現(xiàn)在我們對這一欄有兩個索引了(兩個順序),因此查詢性能又恢復(fù)到了可接受的范圍了。注意查詢?nèi)罩局羞@一行:Index Scan ResultSet for TBL using index TBL_OWNER_DESC
            at read committed isolation level using share row locking
            chosen by the optimizer
            這使我們確信我們使用了新建的索引。因此,如果你經(jīng)常要對結(jié)果進行降序排序的話,你應(yīng)該考慮創(chuàng)建一個合適的索引來獲取更高的性能。
            轉(zhuǎn)自:
            http://space.itpub.net/?uid-47598-action-viewspace-itemid-207379
            posted on 2009-11-24 16:40 chatler 閱讀(1812) 評論(0)  編輯 收藏 引用 所屬分類: Database
            <2009年5月>
            262728293012
            3456789
            10111213141516
            17181920212223
            24252627282930
            31123456

            常用鏈接

            留言簿(10)

            隨筆分類(307)

            隨筆檔案(297)

            algorithm

            Books_Free_Online

            C++

            database

            Linux

            Linux shell

            linux socket

            misce

            • cloudward
            • 感覺這個博客還是不錯,雖然做的東西和我不大相關(guān),覺得看看還是有好處的

            network

            OSS

            • Google Android
            • Android is a software stack for mobile devices that includes an operating system, middleware and key applications. This early look at the Android SDK provides the tools and APIs necessary to begin developing applications on the Android platform using the Java programming language.
            • os161 file list

            overall

            搜索

            •  

            最新評論

            閱讀排行榜

            評論排行榜

            大伊人青草狠狠久久| 久久婷婷成人综合色综合| 欧美大战日韩91综合一区婷婷久久青草| 国产精品免费看久久久香蕉| 一本大道久久东京热无码AV| 精品久久久久久久无码| 欧美亚洲国产精品久久蜜芽| 日本欧美国产精品第一页久久| 亚洲AV无码成人网站久久精品大| 99久久婷婷国产一区二区 | 99精品国产综合久久久久五月天| 精品国际久久久久999波多野| 无码任你躁久久久久久久| 久久人人爽人人爽人人AV东京热| 国产综合精品久久亚洲| 精品久久久久中文字幕日本| 无码人妻久久一区二区三区蜜桃| 国产精品久久久久久久久鸭 | 久久久久久久精品成人热色戒| 国产一级持黄大片99久久| 久久久这里有精品| 久久久久一本毛久久久| 国产精品久久久久无码av| 2021国内精品久久久久久影院| 久久e热在这里只有国产中文精品99| 久久精品毛片免费观看| 国产精品久久久久久久久软件| 精品人妻伦一二三区久久| AV无码久久久久不卡网站下载 | 欧美亚洲国产精品久久蜜芽| 亚洲va中文字幕无码久久不卡| 日韩AV毛片精品久久久| 精品国产青草久久久久福利| 99久久免费只有精品国产| 精品久久久久久国产| 99久久国产热无码精品免费| 久久精品无码专区免费青青| 久久无码人妻一区二区三区 | 国产69精品久久久久777| 久久人人妻人人爽人人爽| 一本色道久久88—综合亚洲精品|