• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            杰 & C++ & Python & DM

            最長遞增子序列(LIS)解法詳述

            求數組中最長遞增子序列(Longest Increasing Subsequence, LIS

            LIS問題是算法中的經典題目,傳統的解法是使用動態規劃,時間復雜度是O(n^2);改進的方法時間復雜度是O(nlogn)。但是關于改進的算法的介紹盡管網上有很多資源,但是有許多看起來沒問題,但是經不起推敲,我看的時候感覺有點看不明白,查閱半天弄懂后再回去看,發現他們的表述有問題,因此總結一下。

            這篇總結使用從傳統解法逐步改進的演繹方法,并給出一些推理。

            如果讀者不喜歡這種演繹思考方法,推薦Slyar的方法,他從另一個角度看待這個問題,寫得十分簡潔,但是沒有接觸過的話,可能不易理解。

            本文仍有許多不足,歡迎指正。



            傳統的解法是使用動態規劃。原理如下:

            data[i]表示數組中的第i個元素;

            lis[i]表示以元素i結尾的最長遞增子序列長度;

            那么lis[i] = max(lis[j]) + 1, j {k | data[k] < data[i], k < i}

            時間復雜度是O(n^2),它的主要優點是算法簡單,可以構造最長遞增子序列。

            int lis[N];
            int LIS_DP(int* data, int n)
            {
                memset(lis, 
            1, n * sizeof(lis[0]));
                
            for(int i=1; i != n; ++i)
                {
                    
            for(int j=0; j != i; ++j)
                    {
                        
            if(data[i] > data[j] && lis[i] < lis[j]+1)
                            lis[i] 
            = lis[j] + 1;
                    }
                }

                
            int max = 0;
                
            for(int i=0; i != n; ++i) 
                    
            if(max < lis[i]) 
                        max 
            = lis[i];
                
            return max;
            }


            另一種方法稍微有些復雜,它是針對上面方法的一種改進,時間復雜度是O(nlogn)。下面使用漸近的方法來分析獲得。

            首先我們來分析一下上面算法的不足,在上面的求解中,每個lis[i]求解的時間復雜度是O(n),但這不是必需的

                         0  1  2  3  4  5  6  7

            data[]:   2  5  6  2  3  4  7  4

            lis[]:      1  2  3  1  2  3  4  3

             

            例如,當求lis[6]時,是不用和data[3]data[4]比較的,因為已經知道它們所在的最大遞增子序列的最后一個元素data[5] < data[6];也就是說,當我們考察第i個元素時,對前面i-1個元素的任何一個遞增子序列,如果這個子序列的最后一個元素比data[i]小,那么就可以將data[i]加在這個子序列后面,構成一個新的更長的遞增子序列,而不用比較這個子序列前面的元素和data[i]的關系。

            由此我們得出第一個啟發式方法,當計算lis[i]時,我們只關心每個前i-1元素中遞增子序列的最后一個元素的值。

            針對第一種方法引入的觀點,提出第二個啟發式方法,同樣求lis[6],對前i-1個元素,獲得兩個長度為3的遞增子序列256234,此時已知data[6] > 6data[6]大于4,所以data[6]可以接在任何一個子序列后面,構成長度為4的新遞增序列。這個時候,會發現一個啟發方法,data[6]不用和6比較,因為只需data[6]大于4就可以得出一個長度為4的遞增序列。

            所以得出第二個啟發式方法,當計算lis[i]時,對同樣長度的子序列,我們只關心它們最后元素的值最小的一個的值。

            由此,由一個數組last_min記錄上面的值,即當計算lis[i]時,last_min[k]表示前i-1個元素中長度為k的所有遞增子序列的最后一個元素的最小值。

            max_len表示當前已獲得的最長的遞增子序列。

            當考察data[i]時,如果data[i] > last_min[max_len],那么將data[i]接在這個序列后面,便構成一個新的長度為max_len+1的序列,該序列的最后一個元素是data[i];否則,找到一個最大的j,使last_min[j]<data[i](由于查找方式,也說明data[i]<=last_min[j+1]),那么把data[i]接在這個序列后面,便構成一個長度為j+1的新序列,更新last_min[j+1]


            int lis[N];                // lis[i]表示以元素i結尾的最長遞增子序列長度
            int last_min[N];        // last_min[i]表示長度為i的所有遞增子序列的
                                    
            // 最后一個元素的最小值
            int max_len;
            int LIS_DP(int* data, int n)
            {
                memset(lis, 
            1, n * sizeof(lis[0]));
                last_min[
            1= data[0];
                max_len 
            = 1;
                
            for(int i=1; i != n; ++i)
                {
                    
            // 如果data[i]比最長遞增序列的最后一個元素大,
                    
            // 那么直接加在它后面便可
                    if (data[i] > last_min[max_len])
                    {
                        
            ++max_len;
                        last_min[max_len] 
            = data[i];
                        lis[i] 
            = max_len;
                    }
                    
            else
                    {
                        
            // 否則查找歷史最長遞增序列
                        for(int j=max_len-1; j != 0--j)
                        {
                            
            if (data[i] > last_min[j])  // 也就是說,data[i] <= last_min[j+1]
                            {
                                lis[i] 
            = j + 1;
                                last_min[j
            +1= data[i]; //更新
                                break;
                            }
                        }
                    }
                }
                
            return max_len;
            }


            如上所示,雖然已經進行了很大的優化,但是當前的時間復雜度仍是O(n^2),當然基本可以確定的是,現在的算法比原來的效率提高了很多。

            下面我們分析一下last_min數組的性質,

            由定義last_min[i]表示長度為i的序列A的最后一個元素的值,last_min[i-1]表示長度為i-1的序列B的最后一個元素的值,那么last_min[i-1]<last[i];否則序列A的前i-1個元素構成的序列便可替代序列B。所以last_min是有序的。

            因此在上面的查找中可以使用二分查找,效率為O(logn),使得總的復雜度為O(nlogn)


             

            // 返回arr中等于或第一個大于val的位置
            int BinarySearch(int* arr, int left, int right, int val)
            {
                
            int mid = 0;
                
            int l = left;
                
            int r = right;

                
            while (l <= r)
                {
                    mid 
            = (l + r) >> 1;
                    
            if (arr[mid] > val) r = mid - 1;
                    
            else if (arr[mid] < val) l = mid + 1;
                    
            else return mid;
                }
                
            return l;
            }

            int last_min[N];        // last_min[i]表示長度為i的所有遞增子序列的
                                    
            // 最后一個元素的最小值
            int max_len;    
            int LIS_DP(int* data, int n)
            {
                last_min[
            1= data[0];
                max_len 
            = 1;
                
            for(int i=1; i != n; ++i)
                {
                    
            // 如果data[i]比最長遞增序列的最后一個元素大,
                    
            // 那么直接加在它后面便可
                    if (data[i] > last_min[max_len])
                    {
                        
            ++max_len;
                        last_min[max_len] 
            = data[i];
                    }
                    
            else
                    {
                        
            // 否則查找歷史最長遞增序列
                        int j = BinarySearch(last_min, 1, max_len, data[i]);
                        last_min[j] 
            = data[i];
                    }
                }
                
            return max_len;
            }

            在程序二中,lis數組完全沒有作用,所以在程序三中沒有使用。

            與程序一相比,程序三在效率上有明顯的提升,但是不能根據last_min構造出最長遞增子序列。

             

            參考文獻

               編程之美—微軟技術面試心得.2.16節


             


            posted on 2011-06-09 23:44 jaysoon 閱讀(3008) 評論(0)  編輯 收藏 引用 所屬分類: ACM/ICPC

            <2025年5月>
            27282930123
            45678910
            11121314151617
            18192021222324
            25262728293031
            1234567

            導航

            統計

            常用鏈接

            留言簿

            隨筆分類

            隨筆檔案

            文章分類

            文章檔案

            收藏夾

            C++

            搜索

            最新評論

            閱讀排行榜

            評論排行榜

            亚洲人AV永久一区二区三区久久| 精品综合久久久久久88小说| 综合久久一区二区三区| 国内精品久久久久久久久电影网| 国产亚洲综合久久系列| 青青青国产成人久久111网站| 亚洲AⅤ优女AV综合久久久| 日韩AV无码久久一区二区| 成人国内精品久久久久影院VR | 国内精品久久久久伊人av| 26uuu久久五月天| 国产aⅴ激情无码久久| 国内精品久久久久久久影视麻豆| 久久久久久久综合狠狠综合| 99久久免费国产特黄| 久久久久亚洲AV无码专区首JN| 99久久精品国内| 久久精品国产清高在天天线| 色天使久久综合网天天| 久久精品国产91久久综合麻豆自制 | 人妻无码αv中文字幕久久| 久久国产香蕉视频| 久久99精品综合国产首页| 99久久免费国产精品特黄| 久久午夜综合久久| 国产精品美女久久久久AV福利| 91视频国产91久久久| 久久综合久久自在自线精品自| 久久久这里有精品| 久久亚洲精品国产亚洲老地址| 狠狠久久综合伊人不卡| 久久免费国产精品一区二区| 精品久久久久久久| 久久久久综合网久久| 色综合合久久天天综合绕视看| 久久这里只有精品首页| 狠狠狠色丁香婷婷综合久久俺| 亚洲国产精品人久久| 久久se这里只有精品| 色综合久久久久综合99| 久久亚洲精品无码VA大香大香|