• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            杰 & C++ & Python & DM

            最長遞增子序列(LIS)解法詳述

            求數組中最長遞增子序列(Longest Increasing Subsequence, LIS

            LIS問題是算法中的經典題目,傳統的解法是使用動態規劃,時間復雜度是O(n^2);改進的方法時間復雜度是O(nlogn)。但是關于改進的算法的介紹盡管網上有很多資源,但是有許多看起來沒問題,但是經不起推敲,我看的時候感覺有點看不明白,查閱半天弄懂后再回去看,發現他們的表述有問題,因此總結一下。

            這篇總結使用從傳統解法逐步改進的演繹方法,并給出一些推理。

            如果讀者不喜歡這種演繹思考方法,推薦Slyar的方法,他從另一個角度看待這個問題,寫得十分簡潔,但是沒有接觸過的話,可能不易理解。

            本文仍有許多不足,歡迎指正。



            傳統的解法是使用動態規劃。原理如下:

            data[i]表示數組中的第i個元素;

            lis[i]表示以元素i結尾的最長遞增子序列長度;

            那么lis[i] = max(lis[j]) + 1, j {k | data[k] < data[i], k < i}

            時間復雜度是O(n^2),它的主要優點是算法簡單,可以構造最長遞增子序列。

            int lis[N];
            int LIS_DP(int* data, int n)
            {
                memset(lis, 
            1, n * sizeof(lis[0]));
                
            for(int i=1; i != n; ++i)
                {
                    
            for(int j=0; j != i; ++j)
                    {
                        
            if(data[i] > data[j] && lis[i] < lis[j]+1)
                            lis[i] 
            = lis[j] + 1;
                    }
                }

                
            int max = 0;
                
            for(int i=0; i != n; ++i) 
                    
            if(max < lis[i]) 
                        max 
            = lis[i];
                
            return max;
            }


            另一種方法稍微有些復雜,它是針對上面方法的一種改進,時間復雜度是O(nlogn)。下面使用漸近的方法來分析獲得。

            首先我們來分析一下上面算法的不足,在上面的求解中,每個lis[i]求解的時間復雜度是O(n),但這不是必需的

                         0  1  2  3  4  5  6  7

            data[]:   2  5  6  2  3  4  7  4

            lis[]:      1  2  3  1  2  3  4  3

             

            例如,當求lis[6]時,是不用和data[3]data[4]比較的,因為已經知道它們所在的最大遞增子序列的最后一個元素data[5] < data[6];也就是說,當我們考察第i個元素時,對前面i-1個元素的任何一個遞增子序列,如果這個子序列的最后一個元素比data[i]小,那么就可以將data[i]加在這個子序列后面,構成一個新的更長的遞增子序列,而不用比較這個子序列前面的元素和data[i]的關系。

            由此我們得出第一個啟發式方法,當計算lis[i]時,我們只關心每個前i-1元素中遞增子序列的最后一個元素的值。

            針對第一種方法引入的觀點,提出第二個啟發式方法,同樣求lis[6],對前i-1個元素,獲得兩個長度為3的遞增子序列256234,此時已知data[6] > 6data[6]大于4,所以data[6]可以接在任何一個子序列后面,構成長度為4的新遞增序列。這個時候,會發現一個啟發方法,data[6]不用和6比較,因為只需data[6]大于4就可以得出一個長度為4的遞增序列。

            所以得出第二個啟發式方法,當計算lis[i]時,對同樣長度的子序列,我們只關心它們最后元素的值最小的一個的值。

            由此,由一個數組last_min記錄上面的值,即當計算lis[i]時,last_min[k]表示前i-1個元素中長度為k的所有遞增子序列的最后一個元素的最小值。

            max_len表示當前已獲得的最長的遞增子序列。

            當考察data[i]時,如果data[i] > last_min[max_len],那么將data[i]接在這個序列后面,便構成一個新的長度為max_len+1的序列,該序列的最后一個元素是data[i];否則,找到一個最大的j,使last_min[j]<data[i](由于查找方式,也說明data[i]<=last_min[j+1]),那么把data[i]接在這個序列后面,便構成一個長度為j+1的新序列,更新last_min[j+1]


            int lis[N];                // lis[i]表示以元素i結尾的最長遞增子序列長度
            int last_min[N];        // last_min[i]表示長度為i的所有遞增子序列的
                                    
            // 最后一個元素的最小值
            int max_len;
            int LIS_DP(int* data, int n)
            {
                memset(lis, 
            1, n * sizeof(lis[0]));
                last_min[
            1= data[0];
                max_len 
            = 1;
                
            for(int i=1; i != n; ++i)
                {
                    
            // 如果data[i]比最長遞增序列的最后一個元素大,
                    
            // 那么直接加在它后面便可
                    if (data[i] > last_min[max_len])
                    {
                        
            ++max_len;
                        last_min[max_len] 
            = data[i];
                        lis[i] 
            = max_len;
                    }
                    
            else
                    {
                        
            // 否則查找歷史最長遞增序列
                        for(int j=max_len-1; j != 0--j)
                        {
                            
            if (data[i] > last_min[j])  // 也就是說,data[i] <= last_min[j+1]
                            {
                                lis[i] 
            = j + 1;
                                last_min[j
            +1= data[i]; //更新
                                break;
                            }
                        }
                    }
                }
                
            return max_len;
            }


            如上所示,雖然已經進行了很大的優化,但是當前的時間復雜度仍是O(n^2),當然基本可以確定的是,現在的算法比原來的效率提高了很多。

            下面我們分析一下last_min數組的性質,

            由定義last_min[i]表示長度為i的序列A的最后一個元素的值,last_min[i-1]表示長度為i-1的序列B的最后一個元素的值,那么last_min[i-1]<last[i];否則序列A的前i-1個元素構成的序列便可替代序列B。所以last_min是有序的。

            因此在上面的查找中可以使用二分查找,效率為O(logn),使得總的復雜度為O(nlogn)


             

            // 返回arr中等于或第一個大于val的位置
            int BinarySearch(int* arr, int left, int right, int val)
            {
                
            int mid = 0;
                
            int l = left;
                
            int r = right;

                
            while (l <= r)
                {
                    mid 
            = (l + r) >> 1;
                    
            if (arr[mid] > val) r = mid - 1;
                    
            else if (arr[mid] < val) l = mid + 1;
                    
            else return mid;
                }
                
            return l;
            }

            int last_min[N];        // last_min[i]表示長度為i的所有遞增子序列的
                                    
            // 最后一個元素的最小值
            int max_len;    
            int LIS_DP(int* data, int n)
            {
                last_min[
            1= data[0];
                max_len 
            = 1;
                
            for(int i=1; i != n; ++i)
                {
                    
            // 如果data[i]比最長遞增序列的最后一個元素大,
                    
            // 那么直接加在它后面便可
                    if (data[i] > last_min[max_len])
                    {
                        
            ++max_len;
                        last_min[max_len] 
            = data[i];
                    }
                    
            else
                    {
                        
            // 否則查找歷史最長遞增序列
                        int j = BinarySearch(last_min, 1, max_len, data[i]);
                        last_min[j] 
            = data[i];
                    }
                }
                
            return max_len;
            }

            在程序二中,lis數組完全沒有作用,所以在程序三中沒有使用。

            與程序一相比,程序三在效率上有明顯的提升,但是不能根據last_min構造出最長遞增子序列。

             

            參考文獻

               編程之美—微軟技術面試心得.2.16節


             


            posted on 2011-06-09 23:44 jaysoon 閱讀(3009) 評論(0)  編輯 收藏 引用 所屬分類: ACM/ICPC

            <2025年5月>
            27282930123
            45678910
            11121314151617
            18192021222324
            25262728293031
            1234567

            導航

            統計

            常用鏈接

            留言簿

            隨筆分類

            隨筆檔案

            文章分類

            文章檔案

            收藏夾

            C++

            搜索

            最新評論

            閱讀排行榜

            評論排行榜

            久久久久99精品成人片三人毛片 | 久久成人国产精品一区二区| 99久久国产热无码精品免费久久久久| 亚洲国产成人久久精品影视| 手机看片久久高清国产日韩| 青青草原精品99久久精品66| 26uuu久久五月天| 精品国产乱码久久久久久人妻| 国产精品久久网| 日日狠狠久久偷偷色综合0 | 久久久综合九色合综国产| 日韩欧美亚洲国产精品字幕久久久| 久久精品国产亚洲AV蜜臀色欲 | 久久99国产精一区二区三区 | 五月丁香综合激情六月久久| 俺来也俺去啦久久综合网| 久久综合色区| 国产福利电影一区二区三区久久老子无码午夜伦不 | 伊人色综合久久天天人手人婷 | 99久久无码一区人妻a黑| 伊人久久成人成综合网222| 欧美亚洲国产精品久久蜜芽| 亚洲中文字幕无码久久2017| 久久久久久亚洲精品不卡 | 久久久综合香蕉尹人综合网| 国产精品久久久久久久久鸭| 久久亚洲精品成人av无码网站| 久久精品亚洲男人的天堂| 狠狠干狠狠久久| 久久精品国产亚洲AV无码娇色 | 久久综合久久久| 97久久久精品综合88久久| 久久亚洲私人国产精品vA| 亚洲成色WWW久久网站| 久久久久久伊人高潮影院| 久久久久久久久久久精品尤物| 青青青青久久精品国产h久久精品五福影院1421 | 久久精品国产免费观看三人同眠| 久久亚洲中文字幕精品一区| 久久强奷乱码老熟女网站| 久久99精品久久久久久野外 |