欧美一二区视频,中日韩美女免费视频网站在线观看,老牛国产精品一区的观看方式

在windows中编译sphinx1.10beta--coreseek(�c�M��)(��译)

漂漂 — Mon, 13 Feb 2012 03:50:00 GMT

在windows中编译sphinx1.10beta

原文地址�Q?a >http://blog.aulin.no/compiling-sphinx-110beta-on-windows

下面是引导大家如何在windows上编译sphinx 1.10beta

1. 下蝲sphinx源码(http://sphinxsearch.com/downloads/sphinx-1.10-beta.tar.gz)
    注：最新版本在�Q?a >http://sphinxsearch.com/downloads/archive/ �?br />
2. 因�ؓsphinx使用到MySQL, LibExpat and LibIConv,因此在编译之前需要配�|�这些库�Q?br />   下蝲MySQL的开发环�?a >http://dev.mysql.com/get/Downloads/MySQL-5.1/mysql-5.1.52-win32.msi/from/http://mysql.borsen.dk/�Q�安装开发组�?br />   下蝲LibExpat(http://garr.dl.sourceforge.net/project/expat/expat_win32/2.0.1/expat-win32bin-2.0.1.exe)
   下蝲LibIConv (http://netcologne.dl.sourceforge.net/project/gnuwin32/libiconv/1.9.2-1/libiconv-1.9.2-1.exe)

3. 在shpinx.h中可以配�|�和�U�除sphinx需要的�l��g,如可以移除对PostgreSQL 的支�?/p>

4. 在visual studiao 08 中打开 Sphinx08.sln

5. ��d��mysql 的include路径(C:\Program Files (x86)\MySQL\MySQL Server 5.1\include) to all projects (叛_�� - Properties - Configuration Properties - C/C++ - General - Additional Include Directories).

6. ��d��mysql的lib路径(C:\Program Files (x86)\MySQL\MySQL Server 5.1\lib\opt) to all projects excluding "libsphinx" (叛_�� - Properties - Configuration Properties - Linker - General - Additional Library Directories)

7. 在除了libsphinx的所有工�E�中�Q�添加LibExpat的�\�?C:\Program Files (x86)\Expat 2.0.1\Bin)(叛_�� - Properties - Configuration Properties - Linker - General - Additional Library Directories)

8. 在除了libsphinx的所有工�E�中�Q�添加LibIConv 的�\�?C:\Program Files (x86)\GnuWin32\lib)(叛_�� - Properties - Configuration Properties - Linker - General - Additional Library Directories)

9. �~�译Build! (F6)

漂漂 2012-02-13 11:50 发表评论

漂漂 — Mon, 11 Oct 2010 09:25:00 GMT

原文地址�Q?a >http://www.cnblogs.com/huaping-audio/archive/2008/09/09/1287985.html

shuffle��法�Q�我把他叫做�z�牌��法�Q�它的目标正好与各种的sort��法相反�Q�即把一个有�?或者无�?的一�p�d��元素打�ؕ�Q�以满��需求�?br>
举个两例子，大家都知道扑克牌�Q�我们每�ơ都需要在摸牌之前把牌�z�掉�Q�用来让每个人摸到每张牌的概率尽量相�{�，增加游戏的随机性和乐趣�Q�还有音频播攑֙��Q�有一些�h不喜�Ƣ顺序播放，而喜�Ƣ��用随机播�?其实随机播放分�ؓ两种,random和shuffle�Q�后文会介绍�?�Q�比如iPod Shuffle的卖点之一��是“你永�q�不知道你将要听到的下一首歌曲是什�?#8221;。至��，如果要模拟扑克牌游戏�Q�或者做音频播放器，都要使用shuffle��法�Q�而二者的shuffle��法却有一些区别，一个是一�ơ性的�z�牌�Q�另一个则是每�ơ取一首歌。那么怎么实现他们呢？

扑克牌的shuffle��法�Q?br>
下面��Z��方便和容易读懂，我都用扑克牌来作例子�Q�桌上有n张牌�Q��ƈ且对桌子上的牌进行标��P��?直到n-1。我们的目的是洗�q�些牌�?br>
一个比较容易想到的�Ҏ��是，桌子上有n张扑克牌�Q�我�W�i�ơ从桌子上等概率随机取一张扑克牌�Q�作为洗牌后牌堆的第i张扑克牌�Q�那么这个算法实现�v来应该是�q�样的：

伪代码：
for i <- 0 to n - 1
do d <- Random mod (n - i)
   shuffle[i] <- deck[d]
   deck[d] <- deck[n - i]

其中�Q�deck是洗牌前的序�?0~n-1)�Q�shuffle是洗牌后的序�?0~n-1)�Q�第i��?�?开始数)在剩下的n-i张牌里等概率的取一张牌�Q�把它放到shuffle里。而deck[d] = deck[n - i]�q�句辑ֈ�的效果是删除取过的牌�?br>
�q�个�Ҏ��的时间复杂度是O(n)�Q�已�l�可以接受了�Q�但�q�个�Ҏ��q�不够好�Q�因为我们需要两个长度�ؓn数组。其实可以很�Ҏ��得得��C��面的�Ҏ��Q�解决空间的问题�Q?br>伪代码：
for i <- 0 to n - 1
do d <- Random mod (n - i)
   swap(deck[d], deck[n - i])

�q�样�Q�这个算法的道理��有些像选择排序了，�W�i��?�?开始数)��定�W�n-i个元素的原位�|�，�q�且交换两个位置上的元素。它的复杂读仍然是O(n)�Q�而只需�?个额外的�I�间来储存交换用的��时变量�?br>�q�个�Ҏ��已经是一个比较好的解��x��法了(自己认�ؓ)�Q�如果你�q�能写出更好的shuffle��法�Q�请告诉我�?br>
我相信对�z�牌�q�种东西有了解的人都不会用这��L��Ҏ��来洗牌：另外�Ҏ��张牌做一个标讎ͼ��x��否抽�q�这张牌�Q�然后第i�ơ在n张牌里随机抽一个，如果�q�张牌曾�l�被抽过�Q�那么把它放回去�Q�重复抽取，直到抽到一张没被抽�q�的牌，��这张牌标记为抽取过的牌�Q�然后在�U怸�的第i个地方记下这张牌。在计算机里�q�样实现�Q?br>
伪代码：
for i <- 0 to n - 1
do d <- Random mod n
   while did[d] = 1
   do d = Random mod n
   did[d] <- 1
   shuffle[i] <- deck[d]

看了描述�Q�你一定就会觉得这�U�方法实在是遭透了�Q�不仅麻烦，而且会有一个陷阱，那就是在某次取牌的时候，也许会运气差永远也取不到没有被取�q�的那张牌，��D��E�序�q�行的不��定性。然而，在初学者当中，却有不少是用�q�种�Ҏ��实现的shuffle的。个��为，在设计算法的时候，��简单、越接近生活的模型，��p��Ҏ��设计出好的算法，而且��法的描�q�C��更接�q�实际生�z�R��因此，设计��法的时候，如果能往�q�x��生活的方面想�Q?��L��事半功倍的�?br>
附上我自己实现的一个类qsort的shuffle��法

// element_Size is the size of each element

void swap(void const *element1, void const *element2, size_t element_Size)
{
    char *temp = new char,
         *elem1, *elem2;
    elem1 = (char *)element1;
    elem2 = (char *)element2;
    for(int i = 0; i < element_Size; i++, elem1++, elem2++){
        *temp = *elem1;
        *elem1 = *elem2;
        *elem2 = *temp;
    }
    delete temp;
}

// array_Size is the size of array,
// element_Size is the size of each element in array

void shuffle(void const *array, size_t array_Size, size_t element_Size)
{
    void *element1, *element2;
    srand(time(0));
    for(int i = 0; i < array_Size / element_Size; i++){
        element1 = (char *)array + i * element_Size;
        element2 = (char *)array + rand(i * element_Size,
            array_Size - element_Size, element_Size);
        swap(element1, element2, element_Size);
    }
}

播放器的shuffle��法�Q?

前面说过播放器的随机播放有两�U�，一�U�叫Random,一�U�叫Shuffle(我自��q��解的......)�Q�下面解释这两种�Ҏ��的不同�?/p>

学过概率的�h都该知道有放回的抽取的概��c��袋中有n个不同的��球�Q�每�ơ抽取一个小球，然后攑֛��Q�每一�ơ取的时候概率都是相同的。这正是播放器random��法的原理，�q�种��法实现��h��很简单，一首歌�l�束以后�Q�只需要随机选取下一首歌��p��了�?br>但是�q�样做有一些缺点：1�Q�有一定的概率使得�q�箋选取的两首歌是同一首歌�Q�我�怿��q�不是所有�h都希望在shuffle模式下连�l�听同一首歌吧，当然也有解决办法�Q�那��是增加层��@环判断，如果选上同一首歌�Q�则重新选，而这样又会重�y�那个很烂的�z�牌��法的覆辙�?�Q�当听完一首歌的时候，觉得�q�想再听一遍，怎么办？按下“上一�?#8221;�Q�你会发现这时听到的歌曲已经不是刚才那一首想听歌曲了�Q�因��U�方法只知道当前的状态，而不知道�q�去的播攄��态。怎么办？一�U�办法是增加一个队列叫�?#8220;刚才播放列表”�Q�把播放�q�的歌曲按照��序储存在列表里�?�Q�有一定概率在很长的一�D�|��间内�Q�播攑֙�不停的在重复播放两首歌曲A和B或者类似情况，��像�q�样�Q?..-A-B-A-B-A-B-...。这�U�情况也是很讨厌的，可是如何避免呢？我能惛_��的办法是增加判断�Q�看�q�首歌是不是在列表的最后几��w��Q�如果在��׃��选这�?.....

但是�q�些概率都小的可怜，对于一个播攑֙�的random函数来说�Q�能够考虑��C��上的几点�Q�已�l�能够做到��够random和�h性化了。只要能够合理的选择参数�Q�考虑��C��些特�D�情�?比如极小的播攑ֈ��?�Q�以及考虑用户的心理，��p��做出一个比较好的random函数�?/p>

下面讲我设计的播攑֙�shuffle��法�Q�shuffle��法能够很大�E�度上避免random��法的缺��P��在空间时间上都很节约�Q�而且能够辑ֈ�比较理想的随机化效果。它的大体思�\是这��L��Q?/p>

我们使用一个隐含的shuffle播放列表(一个��@环队�?来储存歌曲的��序�Q��ƈ用一个指针表�C�正在播攄��歌曲(��C��"^")�Q�比如当前的播放列表是这��L��Q?/p>

ABCDEFGHIJKLMN
^

即现在有14首歌�Q�将要播放位�|?的歌�?正在播放位置14的歌�?�Q�我们认为队列头和尾是相�q�的�Q�即N后面的元素是A�Q�那么这样够成了一个��@环队列�?br>在播放之前，我们在前7(7=14*0.5�Q�这个比例可以随侉K��，当然��大随机性越大，但能后退的次数越��?个位�|�中�Q�随机取一个一首歌�Q�把它和��要播放的那个位�|�的歌曲交换。假设我们选的是E�Q�则队列变成�q�样�Q?/p>

EBCDAFGHIJKLMN
^

然后播放E。E播放完了以后(或者选择下一首时)�Q�重复刚才的动作�Q�即在BCDAFGH中随机选一个，交换�Q�比如选到H�Q�则队列变成�Q?br>EHCDAFGBIJKLMN
^

然后播放H。这��P��一个shuffle��法初步完成了�?/p>

比如某一时刻播放器的状态是�q�样�Q?br>EHCDAFGBIJKLMN
^
则我们在LMNEHCD中选择一个，比如选择到H�Q�那么交换�ƈ播放�Q�成为：
ELCDAFGBIJKHMN
^
但是如果用户选择上一首怎么办呢?我们可以再记录一个指针指向最新shuffle选择出来的那首歌�?��C��"*")�Q�没有选择�q�前一首的时候，它与播放指针指向同一个位�|�。当选择前一首的时候，仅移动指针^�Q�而不�U�d��*�Q�比如上一个例子播攄��时候按下前一首以后，成�ؓ�Q?/p>

ELCDAFGBIJKHMN
^*

�q�时候播攄��K正好是刚才播攄��那一首，当然�q�达��C��我的目的�Q�即可以选到刚才播放的曲目，当然如果再一�ơ选择上一首，��׃��变成�Q?/p>

ELCDAFGBIJKHMN
^ *

�q�时候如果按下一首，应该判断^指向的是不是�?指向的相同，如果相同�Q�就按照最早介�l�的shuffle��法�q�行随机选取�Q�不相同��q��单的�U�d��^�Q�即成�ؓ�Q?/p>

ELCDAFGBIJKHMN
^*

伪代码：
function keypress(key)
   if key = NEXT
      if p1 = p2
      do p1 <- p1 + 1
         p2 <- p2 + 1
         k = Random mod (length / 2)
         swap(p1, (p1 + k) mod length)
         play(p2)
      else
      do p2 <- (p2 + 1) mod length
         play(p2)
   if key = PREV
      do p2 <- (p2 + length - 1) mod length
         play(p2)

�q�个播放器的shuffle��法比较��单实用，而且节约内存开销(�q�对mp3 walkman之类的东西是十分重要�?�Q�当然也有个��缺点，��是当^前移多次回到*以后�Q�再按下一首，则会重新开始shuffle�Q�但是歌曲数目很多的情况下，�q�个�~�点�q�不是那么重要�?br>�q�个��法在刚开始听的时候，�q�不是很随机�Q�可是随着听的�ơ数的增多，队列会越来越乱，辑ֈ�一个shuffle的效果�?br>当然�Q�也可以在第一�ơ对�q�个列表播放之前�Q��用扑克牌的shuffle��法(见本文第一部分)�q�行一�ơshuffle�Q�这��P��刚开始播攄��时候列表就是随机的�?br>通过原理我们可以看到�Q�对于刚听过的那首歌来说�Q�不�l�过length / 2�ơ，是不会再一�ơ听到的�Q�因此很大程度上避免了random��法的缺陗��这个length / 2的参数可以按照具体情况选择�Q�可以是常数�Q�也可以是随机数�Q�也可以是和长度有关的一个数�?nbsp;

漂漂 2010-10-11 17:25 发表评论

协同推荐��法实践之Slope One的介�l�（转）

漂漂 — Mon, 19 Jul 2010 09:49:00 GMT

摘要: Slope One 之一 : ��单高效的协同�q��o��法(�?( 原文地址�Q�http://blog.sina.c... 阅读全文

漂漂 2010-07-19 17:49 发表评论

漂漂 — Sun, 13 Jun 2010 10:19:00 GMT

原文地址�Q?a >http://hi.baidu.com/zavierwong/blog/item/1af5c3d0cd34a4da572c849e.html

�l�常有�h问我�Q�傅里叶变换和拉普拉斯变换的意义。在�q�里我就自己的一些见解，以及�l�合别�h的观�Ҏ��q�如下，希望大家�Ҏ��有所了解�?br> 傅里叶变换（Transformée de Fourier�Q�在物理学、数论、组合数学、信号处理、概率论、统计学、密码学、声学、光学、�v�z�学、结构动力学�{�领域都有着�q�泛的应用（例如在信号处理中�Q�傅里叶变换的典型用途是��信号分解成�q�值分量和频率分量�Q��?br> 傅里叶变换能��满��一定条件的某个函数表示成三角函敎ͼ�正��u�?或余弦函敎ͼ�或者它们的�U�分的线性组合。在不同的研�I��域，傅里叶变换具有多�U�不同的变体形式�Q�如�q�箋傅里叶变换和��L��傅里叶变换�?br> 傅里叶变换是一�U�解决问题的�Ҏ��Q�一�U�工��P��一�U�看待问题的角度。理解的关键是：一个连�l�的信号可以看作是一个个��信��L��叠加�Q�从时域叠加与从频域叠加都可以组成原来的信号�Q�将信号�q�么分解后有助于处理�?br>　　我们原来对一个信号其实是从时间的角度�ȝ��解的�Q�不知不觉中�Q�其实是按照旉��把信可��行分�Ԍ��每一部分只是一个时间点对应一个信号��|��一个信��h��一�l�这��L��分量的叠加。傅里叶变换后，其实�q�是个叠加问题，只不�q�是从频率的角度��d��加，只不�q�每个小信号是一个时间域上覆盖整个区间的信号�Q�但他确有固定的周期�Q�或者说�Q�给了一个周期，我们��p��d��一个整个区间上的分信号�Q�那么给定一�l�周期��|��或频率��|��Q�我们就可以��d��其对应的曲线�Q�就像给出时域上每一点的信号��g��P��不过如果信号是周期的�?�Q�频域的更简单，只需要几个甚至一个就可以了，时域则需要整个时间��u上每一炚w��映射��Z��个函数倹{�?br>　　傅里叶变换就是将一个信��L��时域表示形式映射��C��个频域表�C��Ş式；逆傅里叶变换恰好相反。这都是一个信��L��不同表示形式。它的公式会用就可以�Q�当然把证明看懂了更好�?br>　　对一个信号做傅立叶变换，可以得到光��域特性，包括�q�度和相位两个方面。幅度是表示�q�个频率分量的大��，那么�怽�呢，它有什么物理意义？频域的相位与时域的相位有关系吗？信号前一�D늚��怽��Q�频域）与后一�D늚��怽�的变化是否与信号的频率成正比关系�?br>　　傅立叶变换就是把一个信��P��分解成无数的正��u波（或者余弦�L�Q�信受��也��是��_��用无数的正��u波，可以合成��M��你所需要的信号�?br>　　想一惌��个问题：�l�你很多正��u信号�Q�你怎样才能合成你需要的信号呢？�{�案是要两个条�g�Q�一个是每个正��u波的�q�度�Q�另一个就是每个正弦�L之间的相位差。所以现在应该明白了吧，频域上的�怽��Q�就是每个正弦�L之间的相位。　　
　　傅立叶变换用于信��L��频率域分析，一般我们把电信��h��q�成旉��域的数学模型�Q�而数字信号处理对信号的频率特性更感兴��，而通过傅立叶变换很�Ҏ��得到信号的频率域�Ҏ��　
　　傅里叶变换简单通俗理解��是把看似杂乱无章的信号考虑成由一定振�q�、相位、频率的基本正��u�Q�余弦）信号�l�合而成�Q�傅里叶变换的目的就是找��些基本正弦（余��u�Q�信号中振幅较大�Q�能量较高）信号对应的频率，从而找出杂乱无章的信号中的主要振动频率特点。如减速机故障�Ӟ��通过傅里叶变换做频谱分析�Q�根据各�U��轮�{速、��C��杂音频谱中振�q�大的对比，可以快速判断哪�U��轮损伤�?

拉普拉斯变换�Q�Laplace Transform)�Q�是工程数学中常用的一�U�积分变换�?br> 它是为简化计��而徏立的实变量函数和复变量函数间的一�U�函数变换。对一个实变量函数作拉普拉斯变换，�q�在复数域中作各�U�运��，再将�q�算�l�果作拉普拉斯反变换来求得实数域中的相应�l�果�Q�往往比直接在实数域中求出同样的结果在计算上容易得多。拉普拉斯变换的�q�种�q�算步骤对于求解�U�性微分方�E�尤为有效，它可把微分方�E�化为容易求解的代数方程来处理，从而��计算��化。在�l�典控制理论中，�Ҏ��制系�l�的分析和综合，都是建立在拉普拉斯变换的基础上的�?br> 引入拉普拉斯变换的一个主要优点，是可采用传递函��C��替微分方�E�来描述�pȝ��的特性。这��׃ؓ采用直观和简便的图解�Ҏ��来确定控制系�l�的整个�Ҏ��（见信��h��E�图、动态结构图�Q�、分析控制系�l�的�q�动�q�程�Q�见奈奎斯特�E�_��判据、根轨迹法）�Q�以及综合控制系�l�的校正装置�Q�见控制�pȝ��校正�Ҏ��Q�提供了可能性�?br> 拉普拉斯变换在工�E�学上的应用�Q�应用拉普拉斯变换解常变量齐�ơ微分方�E�，可以��微分方�E�化��Z��数方�E�，佉K��题得以解冟뀂在工程学上�Q�拉普拉斯变换的重大意义在于�Q�将一个信号从时域上，转换为复频域�Q�s域）上来表示�Q�在�U�性系�l�，控制自动化上都有�q�泛的应用�?/p>

漂漂 2010-06-13 18:19 发表评论

A*寻�\初探(�?

漂漂 — Mon, 01 Dec 2008 08:39:00 GMT

摘要: 原文地址�Q�http://www.vckbase.com/document/viewdoc/?id=1422原文出处:http://www.gamedev.net/reference/articles/article2003.asp A*寻�\初探原文�Q�Patrick Lester��译�Q�Panic 2005�q?�?8�? 译者序　　很久以前��q��道了A*��法�Q�但是从... 阅读全文

漂漂 2008-12-01 16:39 发表评论

�U�黑树（Red-Black Tree�Q?�?

漂漂 — Sat, 22 Nov 2008 06:16:00 GMT

原文地址�Q?a >http://imlazy.ycool.com/post.1104022.html

�Q�阅��L��文之前请先了解二叉搜索树�Q?span lang=EN-US>

�U�黑树（Red-Black Tree�Q?span lang=EN-US>

�U�黑树（Red-Black Tree�Q�是二叉搜烦树（Binary Search Tree�Q�的一�U�改�q�。我们知道二叉搜索树在最坏的情况下可能会变成一个链�?/span>�Q�当所有节�Ҏ��从小到大的顺序依�ơ插入后�Q�。而红黑树在每一�ơ插入或删除节点之后都会�?span lang=EN-US>O�Q?span lang=EN-US>log N�Q�的旉��来对树的�l�构作修改，�?span style="COLOR: red">保持树的�q��。也��是��_��U�黑树的查找�Ҏ��与二叉搜索树完全一��P��插入和删除节点的的方法前半部分节与二叉搜索树完全一��P��而后半部分添加了一些修�Ҏ��的结构的操作�?span lang=EN-US>

�U�黑树的每个节点上的属性除了有一�?span lang=EN-US>key�?span lang=EN-US>3个指针：parent�?span lang=EN-US>lchild�?span lang=EN-US>rchild以外�Q?span style="COLOR: red">�q�多了一个属性：color�?/span>它只能是两种颜色�Q�红或黑。而红黑树除了��h��二叉搜烦树的所有性质之外�Q�还��h��以下4�Ҏ��质�Q?span style="COLOR: red">�Q��ؓ什么只要这些性质��p��解决�q�个问题�Q�其实还是一个问题）

1. 根节�Ҏ��黑色的�?span lang=EN-US>

2. �I��Ҏ��黑色的（�U�黑树中�Q�根节点�?span lang=EN-US>parent以及所有叶节点lchild�?span lang=EN-US>rchild都不指向NULL�Q�而是指向一个定义好的空节点�Q��?span lang=EN-US>

3. �U�色节点的父、左子、右子节炚w��是黑艌Ӏ?span lang=EN-US>

4. 在�Q何一��子树中�Q�每一条从根节点向下走到空节点的�\径上包含的黑色节�Ҏ��量都相同�?span lang=EN-US>
如下囑ְ�是一��늺�黑树�Q?span lang=EN-US>

有了�q�几条规则，��可以保证整��|��的��^衡，也就�{�于保证了搜索的旉��?span lang=EN-US>O�Q?span lang=EN-US>log N�Q��?span lang=EN-US>

但是在插入、删除节点后�Q�就有可能破坏了�U�黑树的性质。所以我们要做一些操作来把整��|��修补好。下面我��来介绍一下�?span lang=EN-US>

首先有一个预备知识，那就是节点的Left-Rotate�?span lang=EN-US>Right-Rotate操作。所�?span lang=EN-US>Left-Rotate(x)��是把节�?span lang=EN-US>x向左下方向移动一��|��然后�?span lang=EN-US>x原来的右子节点代替它的位�|�。�?span lang=EN-US>Right-Rotate当然��是�?span lang=EN-US>Left-Rotate左、右互反一下。如下图�Q?span lang=EN-US>

注意�Q?span lang=EN-US>Left-Rotate(x)后，x的右子树变成了原�?span lang=EN-US>y的左子树�Q?span lang=EN-US>Right-Rotate反之。思考一下，�q�样一�ơ变换后�Q�仍�?span style="COLOR: red">满��二叉搜烦树的性质�Q?span style="COLOR: red">中序遍历�q�没有改�?/span>�Q�。在�U�黑树的插入、删除中�Q�要用到很多Left-Rotate�?span lang=EN-US>Right-Rotate操作�?span lang=EN-US>

//把一个节点向左下方移一��|��q�让他原来的叛_��节点代替它的位置�?/span>
void leftRotate(RBTNode* node)

{
        RBTNode* right = node->rchild;
        node->rchild = right->lchild;
        node->rcount = right->lcount;
        node->rchild->parent = node;
        right->parent = node->parent;
        if (right->parent == m_null) {
            m_root = right;
        }
        else if (node == node->parent->lchild) {
            node->parent->lchild = right;
        }
        else {
            node->parent->rchild = right;
        }
        right->lchild = node;
        right->lcount += node->lcount + 1;
        node->parent = right;
    }

    //把一个节点向右下方移一��|��q�让他原来的左子节点代替它的位置�?/span>
    inline void rightRotate(RBTNode* node) {
        RBTNode* left = node->lchild;
        node->lchild = left->rchild;
        node->lcount = left->rcount;
        node->lchild->parent = node;
        left->parent = node->parent;
        if (left->parent == m_null) {
            m_root = left;
        }
        else if (node == node->parent->lchild) {
            node->parent->lchild = left;
        }
        else {
            node->parent->rchild = left;
        }
        left->rchild = node;
        left->rcount += node->rcount + 1;
        node->parent = left;
    }

一�?插入

插入首先是按部就班二叉搜索树的插入步骤，把新节点z插入到某一个叶节点的位�|�上�?span lang=EN-US>
接下来把z的颜色设�?span style="COLOR: red">�U�色�?span style="COLOR: red">��Z��么？�q�记得红黑树的性质吗，从根节点向下到空节点的每一条�\径上的黑色节�Ҏ��要相同。如果新插入的是黑色节点�Q�那么它所在的路径上就�?span style="COLOR: red">��Z��一个黑色的节点了。所以新插入的节点一定要设成�U�色。但是这样可能又有一个矛盾，如果z的父节点也是�U�色�Q�怎么办，前面说过�U�色节点的子节点必须是黑艌Ӏ�因此我们要执行下面一个�P代的�q�程�Q�称�?span lang=EN-US>Insert-Fixup�Q�来修补�q�棵�U�黑树�?span lang=EN-US>

�?span lang=EN-US>Insert-Fixup中，每一�ơ�P代的开始，指针z一定都指向一个红色的节点。如�?span lang=EN-US>z->parent是黑�Ԍ��那我们就大功告成了；如果z->parent是红�Ԍ��昄��q�就�q�返了红黑的树性质�Q�那么我们要惛_��法把z或�?span lang=EN-US>z->parent变成黑色�Q�但�q�要建立在不破坏�U�黑树的其他性质的基��上�?span lang=EN-US>

�q�里再引入两个指针：grandfather�Q�指�?span lang=EN-US>z->parent->parent�Q�也��是z的爷�?span lang=EN-US>(昄��׃��z->parent为红�Ԍ��grandfather一定是黑色)�Q?span lang=EN-US>uncle�Q�指�?span lang=EN-US>grandfather除了z->parent之外的另一个子节点�Q�也��是z的父亲的兄弟�Q�所以叫uncle�?span lang=EN-US>

�Q��ؓ了说话方便，我们�q�里都假�?span lang=EN-US>z->parent�?span lang=EN-US>grandfather的左子节点，�?span lang=EN-US>uncle�?span lang=EN-US>grandfather的右子节炏V��如果遇到的实际情况不是�q�样�Q�那也只要把所有操作中的左、右互反��可以了。）

在每一�ơ�P代中�Q�我们可能遇��C��下三�U�情��c�?span lang=EN-US>

Case 1. uncle也是�U�色。这时只要把z->parent�?span lang=EN-US>uncle都设成黑�Ԍ��q�把grandfather设成�U�色。这样仍然确保了每一条�\径上的黑色节�Ҏ��不变。然后把z指向grandfather�Q��ƈ开始新一轮的�q�代。如下图�Q?span lang=EN-US>

�?span lang=EN-US>1�Q�我们可以看出左边的图，各条路径包含黑颜色的数目是正��的�Q�只是颜色不对而已�Q�我们把它分成两�Ҏ��看，卛_��节点D应该包含N+1个黑色节点，其中�q�个1�?span lang=EN-US>C�Q��?span lang=EN-US>N�?span lang=EN-US>C以上的黑色节点个数。同�?span lang=EN-US>A也应该是N+1�Q?span lang=EN-US>B也是N+1�Q�调整以后，看看我们��实没有改变�?span lang=EN-US>A�?span lang=EN-US>B�?span lang=EN-US>D的所包含的黑色节�Ҏ��。下面的情况也可以同��L��Ҏ��来分析�?span lang=EN-US>

Case 2. uncle是黑�Ԍ��q�且z�?span lang=EN-US>z->parent的右子节炏V��这时我们只要把z指向z->parent�Q�然后做一��?span lang=EN-US>Left-Rotate(z)。就可以把情况�{化成Case 3�?span lang=EN-US>

Case 3. uncle是黑�Ԍ��q�且z�?span lang=EN-US>z->parent的左子节炏V��到了这一步，我们��剩最后一步了。只要把z->parent设成黑色�Q�把grandfather设成�U�色�Q�再做一��?span lang=EN-US>Right-Rotate(grandfather)�Q�整��|��׃��补完毕了。可以思考一下，�q�样一�ơ操作之后，��实满��了所有红黑树的性质�?span lang=EN-US>Case 2�?span lang=EN-US>Case 3如下图：

反复�q�行�q�代�Q�直到某一�ơ�P代开始时z->parent为黑色而告�l�，也就是当遇到Case 3后，做完它而告�l��?span lang=EN-US>

void insertFixup(RBTNode* insertNode) {
RBTNode* p = insertNode;
while (p->parent->color == RED) {

//z->parent�?/span>grandfather的左子节�?/span>,下面是三�U�情�?/span>
            if (p->parent == p->parent->parent->lchild) {
                RBTNode* parentRight = p->parent->parent->rchild;
                if (parentRight->color == RED) {
                    p->parent->color = BLACK;
                    parentRight->color = BLACK;
                    p->parent->parent->color = RED;
                    p = p->parent->parent;
                }
                else {
                    if (p == p->parent->rchild) {
                        p = p->parent;
                        leftRotate(p);
                    }
                    p->parent->color = BLACK;
                    p->parent->parent->color = RED;
                    rightRotate(p->parent->parent);
                }
            }
            else {
                RBTNode* parentLeft = p->parent->parent->lchild;
                if (parentLeft->color == RED) {
                    p->parent->color = BLACK;
                    parentLeft->color = BLACK;
                    p->parent->parent->color = RED;
                    p = p->parent->parent;
                }
                else {
                    if (p == p->parent->lchild) {
                        p = p->parent;
                        rightRotate(p);
                    }
                    p->parent->color = BLACK;
                    p->parent->parent->color = RED;
                    leftRotate(p->parent->parent);
                }
            }
        }
        m_root->color = BLACK;
    }

二、删�?span lang=EN-US>

让我们来回顾一下二叉搜索树的删除节�?span lang=EN-US>z的过�E�：如果z没有子节点，那么直接删除卛_��Q�如�?span lang=EN-US>z只有一个子节点�Q�那么让�q�个子节�Ҏ��代替z的位�|�，然后�?span lang=EN-US>z删除卛_��Q�如�?span lang=EN-US>z有两个子节点�Q�那么找�?span lang=EN-US>z在中序遍历中的后�l�节�?span lang=EN-US>s�Q�也��是�?span lang=EN-US>z->rchild开始向左下方一直走到底的那一个节点）�Q�把s�?span lang=EN-US>key赋值给z�?span lang=EN-US>key�Q�然后删�?span lang=EN-US>s�?span lang=EN-US>

�U�黑树中删除一个节�?span lang=EN-US>z的方法也是首先按部就班以上的�q�程�?span lang=EN-US>

按照二叉搜烦树的删除�Ҏ��删除节点�Q�如果删除节�Ҏ��U�色�?/span>�Q�那�q?span style="COLOR: red">不会改变�U�黑树的性质。如果删除的节点�?span style="COLOR: red">黑色�?/span>�Q�那么显然它所在的路径上就��一个黑色节点，那么�U�黑树的性质��p��破坏�?/span>。这时我们就要执行一个称�?span lang=EN-US>Delete-Fixup的过�E�，来修补这��|��。下面我��来讲解一下�?span lang=EN-US>

一个节点被删除之后�Q�一定有一个它的子节点代替了它的位�|�（即��是叶节点被删除后�Q�也会有一个空节点来代替它的位�|�。前面说�q�，在红黑树中，�I��Ҏ��一个实际存在的节点。）。我们就设指�?span lang=EN-US>x指向�q�个代替位置的节炏V�?span lang=EN-US>
昄��Q�如�?span lang=EN-US>x是红色的�Q�那么我们只要把它设成黑�Ԍ��它所在的路径上就重新多出了一个黑色节点，那么�U�黑树的性质��满��了�?span lang=EN-US>
然而，如果x是黑色的�Q�那我们��p��假想x上背负了2个单位的黑色。那么红黑树的性质也同样不破坏�Q�但是我们要扑ֈ�某一个红色的节点�Q�把x�?span lang=EN-US>“��蝲”的这1个单位的黑色丢给它，�q�样才算完成�?span lang=EN-US>Delete-Fixup做的��是�q�个工作�?span lang=EN-US>

注：删除了一个黑色节点以后，遍历到节点一下的叶子节点比遍历其他分支的叶子节点的黑色节�Ҏ��少了一个，�q�就要是扑ֈ�一个红�Ԍ��把这个节�Ҏ��成黑色来拟补�q�个删除的黑色节点，使得遍历到叶子节点经�q�黑色节点的数目一栗��?span lang=EN-US>

Delete-Fixup同样是一个��@环�P代的�q�程。每一�ơ�P代开始时�Q�如果指�?span lang=EN-US>x指向一个红色节点，那么大功告成�Q�把它设成黑色即告终。相反如�?span lang=EN-US>x黑色�Q�那么我们就会面�?span style="COLOR: red">以下4�U�情�?/span>�?span lang=EN-US>

�q�里引入另一个指�?span lang=EN-US>w�Q�指�?span lang=EN-US>x的兄弟。这里我们都默认x�?span lang=EN-US>x->parent的左子节点，�?span lang=EN-US>w�?span lang=EN-US>x->parent的右子节炏V��（如果实际遇到相反的情况，只要把所有操作中的左、右互反一下就可以了。）

Case 1. w是红艌Ӏ�这时我们根据红黑树的性质可以肯定x->parent是黑艌Ӏ?span lang=EN-US>w->lchild是黑艌Ӏ�我们把x->parent�?span lang=EN-US>w的颜色互换，然后做一��?span lang=EN-US>Left-Rotate(x->parent)。做完之�?span lang=EN-US>x��有了一个新的兄弟：�?span lang=EN-US>w->lchild�Q�前面说�q�它一定是黑色的。那么我们就在不破坏�U�黑树性质的前提下�Q�把Case 1转换成了Case2�?span lang=EN-US>3�?span lang=EN-US>4中的一个，也就�?span lang=EN-US>w是黑色的情况。思考一下，�q�样做不会改变每条�\径上黑色节点的个敎ͼ�如下图：

注：可以看出�q�样变化以后��变成了Case2了�?span lang=EN-US>

Case 2. w是黑�Ԍ��q�且w的两个子节点都是黑色。这时我们只要把w设成�U�色。然后把x�U�d��x->parent�Q�开始下一轮�P代（注意�Q�那“��蝲”�?span lang=EN-US>1单位的黑色始�l�是跟着指针x走的�Q�直�?span lang=EN-US>x走到了一个红色节点上才能把它“�怸�”�Q�。思考一下，�q�一�ơ操作不会破坏红黑树的性质。如下图�Q�图中节�?span lang=EN-US>B不一定是�U�色�Q�也可能是黑�Ԍ��Q?span lang=EN-US>

注：�q�里只要�?span lang=EN-US>B变成�U�色��大功告成了�?span lang=EN-US>

Case 3. w是黑�Ԍ��q�且w的两个子节点左红右黑。这时我们把w�?span lang=EN-US>w->lchild的颜色互换，然后�?span lang=EN-US>Right-Rotate(w)。思考一下，�q�样做之后不会破坏红黑树的性质。这�?span lang=EN-US>x的新的兄弟就是原w->lchild�?span style="COLOR: red">�?span lang=EN-US>Case 3被�{化成�?span lang=EN-US>Case 4�?/span>

Case 4. w是黑�Ԍ��q�且w的右子节�Ҏ��U�色。一但遇�?span lang=EN-US>Case 4�Q�就胜利在望了。我看下面一张图。先�?span lang=EN-US>w�?span lang=EN-US>x->parent的颜色互换，再做Left-Rotate(x->parent)。这时图中节�?span lang=EN-US>E�Q�也��是�?span lang=EN-US>w->rchild�Q�所在的路径��p��定少了一个黑�Ԍ��?span lang=EN-US>x所在的路径则多了一个黑艌Ӏ�那么我们就�?span lang=EN-US>x上多余的1个单位的黑色丢给E��可以了。至此，Delete-Fixup��顺利完成了�?span lang=EN-US>

注：通过�?span lang=EN-US>1我们可以看出问题�?span lang=EN-US>Case4后已�l�解决了�?span lang=EN-US>

void delFixup(RBTNode* delNode) {

RBTNode* p = delNode;

while (p != m_root && p->color == BLACK) {

if (p == p->parent->lchild) {//左边情况�Q�以下是四种不同�?/span>Case

RBTNode* sibling = p->parent->rchild;

if (sibling->color == RED) {

sibling->color = BLACK;

p->parent->color = RED;

leftRotate(p->parent);

sibling = p->parent->rchild;

}

if (sibling->lchild->color == BLACK

&& sibling->rchild->color == BLACK

) {

sibling->color = RED;

p = p->parent;

}

else {

if (sibling->rchild->color == BLACK) {

sibling->lchild->color = BLACK;

sibling->color = RED;

rightRotate(sibling);

sibling = sibling->parent;

}

sibling->color = sibling->parent->color;

sibling->parent->color = BLACK;

sibling->rchild->color = BLACK;

leftRotate(sibling->parent);

p = m_root;

}

else {//双��情况

RBTNode* sibling = p->parent->lchild;

if (sibling->color == RED) {

sibling->color = BLACK;

p->parent->color = RED;

rightRotate(p->parent);

sibling = p->parent->lchild;

}

if (sibling->lchild->color == BLACK

&& sibling->rchild->color == BLACK

) {

sibling->color = RED;

p = p->parent;

}

else {

if (sibling->lchild->color == BLACK) {

sibling->rchild->color = BLACK;

sibling->color = RED;

leftRotate(sibling);

sibling = sibling->parent;

}

sibling->color = sibling->parent->color;

sibling->parent->color = BLACK;

sibling->lchild->color = BLACK;

rightRotate(sibling->parent);

p = m_root;

}

p->color = BLACK;

}

漂漂 2008-11-22 14:16 发表评论

数学之美番外��：快排��Z��么那样快(转）

漂漂 — Fri, 21 Nov 2008 11:07:00 GMT

原文地址�Q?a >http://blog.csdn.net/pongba/archive/2008/06/13/2544933.aspx

By 刘未�?span lang=EN-US>(pongba)

C++的罗��宫(http://blog.csdn.net/pongba)

TopLanguage(http://groups.google.com/group/pongba)

0. 前言

1. 猜数�?span lang=EN-US>

2. �U�球

3. 排序

3.1 ��Z��么堆排比快排�?span lang=EN-US>

3.2 ��Z��么快排其实也不是那么�?span lang=EN-US>

3.3 基排又�ؓ什么那么快�?span lang=EN-US>

4. 信息论！信息论？

5. ��结

0. 前言

知道�q�个理论是在TopLanguage上的一�ơ讨论，先是g9转了David MacKay的一��文�?/span>�Q�然后引发了牛�h们的一场关于信息论的讨�?/font>�?span lang=EN-US>Anyway�Q�正�?span lang=EN-US>g9很久以前�?span lang=EN-US>Blog里面所�?/font>的：

有时无知是福。俺看到一�Ҏ��鲜的�U�普也能觉得造化��奇。刚才读Gerald Jay Sussman�Q?span lang=EN-US>SICP作者）的文章，Building Robust Systems – an essay�Q�竟然心如小鹿�ؕ撞，手心湿润�Q�仿佛第一�ơ握住初恋情人温柔的手�?span lang=EN-US>

而看�?span lang=EN-US>MacKay的这��文章我也有�q�种感觉—�?/span>以前模糊的东西忽然有了深�ȝ��解释�Q�一切顿时变得明白无比。原来看问题的角度或层面能够带来�q�么大的变化。再一�ơ印证了��是深刻的原理往往��是��单和强大。所以说�Q�土鳖也有土鳖的�q�福:P

�q�篇文章相当�?span lang=EN-US>MacKay原文的白话文版�?span lang=EN-US>MacKay在原文中用到了信息论的知识，后者在我看来�ƈ不是必须的，��管计算的时候方便，但与本质无关。所以我用大白话解释了一通�?

1. 猜数�?

我们先来玩一个猜数字游戏�Q�我心里默念一�?span lang=EN-US>1~64之间的数�Q�你来猜�Q�你只能问答案是“�?span lang=EN-US>”�?span lang=EN-US>“�?span lang=EN-US>”的问题）。�ؓ了保证不论在什么情况下都能以尽量少的次数猜中，你应该采取什么策略呢�Q�很昄��Q�二分。先是猜是不是位�?span lang=EN-US>1~32之间�Q�排除掉一半可能性，然后对区间��l�二分。这�U�策略能够保证无论数字怎么跟你捉迷藏，都能�?span lang=EN-US>log_2{n}�ơ以内猜中。用��法的术语来说就是它的下界是最好的�?

我们再来回顾一下这个游戏所蕴含的本质：��Z��么这�U�策略具有最优下界？�{�案也很��单，�q�个�{�略是��^衡的。反之如果策略不是��^衡的�Q�比如问是不是在1~10之间�Q�那么一旦发��C��是在1~10之间的话��׃��剩下�?span lang=EN-US>N/2更多的可能性需要去考察了�?

徐宥在讨��Z��提到�Q�这�U�策略的本质可以概括�?span lang=EN-US>“让未知世界无机可�?span lang=EN-US>”。它是没�?span lang=EN-US>“��q��?span lang=EN-US>”�Q�答案的��M��一个分支都是等概率的。反之，一旦某个分支蕴含的可能性更多，当情况落到那个分支上的时候你��郁闷了。比如猜数字游戏最�p�糕的策略就是一个一个的猜：�?span lang=EN-US>1吗？�?span lang=EN-US>2吗？... 因�ؓ�q�种猜法最差的情况下需�?span lang=EN-US>64�ơ才能猜对，下界非常�p�糕。二分搜索�ؓ什么好�Q�就是因为它每次都将可能性排除一半�ƈ且无论如何都能排除一半（它是最�p�情况下表现最好的�Q��?

2. �U�球

12个小球，其中有一个是坏球。有一架天�q�뀂需要你用最��的�U�次数来��定哪个��球是坏的�ƈ且它到底是轻�q�是重�?

�q�个问题是一道流传已久的智力题。网�l�上也有很多讲解�Q�还有泛化到N个球的情况下的严��D��明。也有零星的一些地�Ҏ��C��信息论的角度来看待最优解法。本来我一直认��道题目除了试错之外没有其它高妙的思�\了，只能一个个�Ҏ��试，�q�尽量从�l�果中寻找信息，然后看看哪种�Ҏ��最��?

然而，实际上它的确有其它的思�\�Q�一个更本质的思�\�Q�而且�Ҏ��用不着信息��么拗口的知识�?

我们先回��一下猜数字游戏。�ؓ了保证�Q何情况下以最��次数猜中，我们的策略是每次都排除恰好一半的可能性。类比到�U�球问题上：坏球可能�?span lang=EN-US>12个球中的��L��一个，�q�就�?span lang=EN-US>12�U�可能性；而其中每�U�可能性下坏球可能��M��可能重。于�?span lang=EN-US>“坏球是哪个球�Q�是��L��?span lang=EN-US>”�q�个问题的答案就�?span lang=EN-US>12×2=24�U�可能性。现在我们用天��^来称球，��q��同于对这24�U�可能性发问，�׃��天��^的输出结果有三种“�q��、左倾、右�?span lang=EN-US>”�Q�这��q��当于我们的问题有三个�{�案�Q�即可以��所有的可能性切成三份，�Ҏ��猜数字游戏的启发�Q�我们应当尽量让�q�三个分支概率均�{�，卛_�^均切分所有的可能性�ؓ三等份。如此一来的话一�ơ称量就可以��答案的可能性羃减�ؓ原来�?span lang=EN-US>1/3�Q�三�ơ就能羃减�ؓ1/27。而��d��才有24�U�可能性，所以理��Z��是完全可�?span lang=EN-US>3�ơ称出来的�?

如何�U�的指导原则有了�Q�构造一个称的策略就不是什么太困难的事情了。首先不妨解释一下�ؓ什么最直观的称法不是最优的—�?�?span lang=EN-US>6�U�ͼ��?span lang=EN-US>6�?span lang=EN-US>6�U�的时候，天��^�q��的可能性是0。刚才说了，最优策略应该��得天�q�三�U�状态的概率均等�Q�这��h��能三�{�分�{�案的所有可能性�?

��Z��更清楚的看待�q�个问题�Q�我们不妨假设有6个球�Q�来考虑一�?span lang=EN-US>3�?span lang=EN-US>3�U�和2�?span lang=EN-US>2�U�的区别�Q?

在未�U�C��前，一共有12�U�可能性：1轅R�?span lang=EN-US>1重�?span lang=EN-US>2轅R�?span lang=EN-US>2重�?span lang=EN-US>...�?span lang=EN-US>6轅R�?span lang=EN-US>6重。现在将1�?span lang=EN-US>2�?span lang=EN-US>3��h��在左边，4�?span lang=EN-US>5�?span lang=EN-US>6攑֜�双��3�?span lang=EN-US>3�U�C��之后�Q�不�׃��般性假讑֤��q�_��倾，那么��球的可能性就变成了原来的一半（6�U�）�Q?span lang=EN-US>1重�?span lang=EN-US>2重�?span lang=EN-US>3重�?span lang=EN-US>4轅R�?span lang=EN-US>5轅R�?span lang=EN-US>6轅R��即�q�种�U�法能排除一半可能性�?

现在再来�?span lang=EN-US>2�?span lang=EN-US>2�U�法�Q�即1�?span lang=EN-US>2攑ַ�边，3�?span lang=EN-US>4攑֏�边，剩下�?span lang=EN-US>5�?span lang=EN-US>6不称�Q�放一辏V��假讄��果是天��^�q��Q�那么可能性剩�?span lang=EN-US>—�?�U�：5重�?span lang=EN-US>5轅R�?span lang=EN-US>6重�?span lang=EN-US>6轅R��假讑֤��q�_��倾，可能性也剩下4�U�：1重�?span lang=EN-US>2重�?span lang=EN-US>3轅R�?span lang=EN-US>4轅R��右們֒�左倄��情况�c�M��。��M��Q�这�U�称法，不管天��^�l�果如何�Q�情况都被我们羃��到了原来的三分之一�Q�我们充分利用了“天��^的结果状态可能有三种”�q�个条�g来三�{�分所有可能性，而不是二�{�分�?

说到�q�里�Q�剩下的事情��实在很��单了�Q�第二步�U�法�Q�只要记着�q�样一个指导思想—�?/span>你选择的称法必��M��得当天��^�q��的时候答案剩下的可能性和天��^左倾（叛_��）的时候答案剩下的可能性一样多。实际上�Q�这�{�同于你得选择一�U�称法，使得天��^输出三种�l�果的概率是均等的，因�ؓ天��^输出某个�l�果的概率就�{�同于所有支持这个结果（左倾、右倾、��^衡）的答案可能性的和，�q�且�{�案的每个可能性都是等概率的�?

MacKay在他的书�?span lang=EN-US>Information Theory: Inference and Learning Algorithms》（作者开攑օ�费电子书�Q�里�?span lang=EN-US>4.1节专门讲了这个称球问题，�q�画了一张不错的图，我就照抄了：

图中“1+”是指“1号小球�ؓ�?span lang=EN-US>”�q�一可能性。一开始一共有24�U�可能性�?span lang=EN-US>4�?span lang=EN-US>4�U�C��之后不管哪种情况�Q�分支）�Q�剩下来的可能性��L��4�U�。这是一个完��的三分。然后对每个分支构造第二次�U�法�Q�这里你只要�E�加演算��可以发玎ͼ�分支1上的�W�二�ơ称法，�?span lang=EN-US>“1�?span lang=EN-US>2�?span lang=EN-US>6�?span lang=EN-US>3�?span lang=EN-US>4�?span lang=EN-US>5”�q�种�U�法�Q�天�q��Z��U�结果的可能性是均等的（严格来说是几乎均�{�）。这��是��Z��么这个称法能够在最坏的情况下也能表现最好的原因�Q�没有哪个分支是它的��q��Q�它必然能将情况�~�小到原来的1/3�?

3. 排序

用前面的看问题视角，排序的本质可以这��h��表述�Q�一�l�未排序�?span lang=EN-US>N个数字，它们一共有N!�U�重排，其中只有一�U�排列是满��题意的（譬如从大到小排列�Q�。换句话��_��排序问题的可能性一共有N!�U�。�Q何基于比较的排序的基本操作单元都�?span lang=EN-US>“比较a�?span lang=EN-US>b”�Q�这��q��当于猜数字游戏里面的一个问句，昄��q�个问句的答案只能是“�?span lang=EN-US>”�?span lang=EN-US>“�?span lang=EN-US>”�Q�一个只有两�U�输出的问题最多只能将可能性空间切成两半，�Ҏ��上面的思�\�Q�最佛_��法就是切�?span lang=EN-US>1/2�?span lang=EN-US>1/2。也��是��_��我们希望在比较了a�?span lang=EN-US>b的大��关�p�M��后，如果发现a的话剩下的排列可能性就变成N!/2�Q�如果发�?span lang=EN-US>a>b也是剩下N!/2�U�可能性。由于假设每�U�排列的概率是均�{�的�Q�所以这也就意味着支持a的排列一共有N!/2个，支持a>b的也�?span lang=EN-US>N!/2个，换言之，a的概率等�?span lang=EN-US>a>b的概率�?

我们希望每次在比�?span lang=EN-US>a�?span lang=EN-US>b的时候，a�?span lang=EN-US>a>b的概率是均等的，�q�样我们��p��保证无论如何都能��可能性羃��ؓ原来的一半了�Q�最优下界�?

一个直接的推论是，如果每次都像上面�q�样的完��比较，那么N个元素的N!�U�可能排列只需�?span lang=EN-US>log_2{N!}��排查玩了，�?span lang=EN-US>log_2{N!}�q�似�?span lang=EN-US>NlogN。这正是快排的复杂度�?

3.1 ��Z��么堆排比快排�?

回顾一下堆排的�q�程�Q?

1. 建立最大堆�Q�堆��的元素大于其两个儿子，两个儿子又分别大于它们各自下属的两个儿子... 以此�c�L��Q?

2. ��堆��的元素和最后一个元素对调（相当于将堆顶元素�Q�最大��|��拿走�Q�然后将堆底的那个元素补上它的空�~�）�Q�然后让那最后一个元素从��上往下滑到恰当的位置�Q�重��C��堆最大化�Q��?

3. 重复�W?span lang=EN-US>2步�?

�q�里的关键问题就在于�W?span lang=EN-US>2步，堆底的元素肯定很��，��它拿到堆顶和原本属于最大元素的两个子节�Ҏ��较，它比它们大的可能性是微乎其微的。实际上它肯定小于其中的一个儿子。而大于另一个儿子的可能性非常小。于是，�q�一�ơ比较的�l�果��是概率不均�{�的�Q�根据前面的分析�Q�概率不均等的比较是不明智的�Q�因为它�q�不能保证在�p�糕情况下也能将问题的可能性削减到原本�?span lang=EN-US>1/2。可以想像一�U�极端情况，如果a肯定��于b�Q�那么比�?span lang=EN-US>a�?span lang=EN-US>b��׃��什么信息也得不�?span lang=EN-US>—�?/span>原本剩下多少可能性还是剩下多��可能性�?

在堆排里面有大量�q�种�q�乎无效的比较，因�ؓ被拿到堆��的那个元素几乎肯定是很��的�Q�而靠�q�堆��的元素又几乎肯定是很大的，��一个很��的数和一个很大的数比较，�l�果几乎肯定�?span lang=EN-US>“��于”的，�q�就意味着问题的可能性只被排除掉了很��一部分�?

�q�就是�ؓ什么堆排比较慢�Q�堆排虽然和快排一样复杂度都是O(NlogN)但堆排复杂度的常�p�L��更大�Q��?

MacKay也提供了一个修改版的堆排：每次不是��堆底的元素拿到上面去，而是直接比较堆顶�Q�最大）元素的两个儿子，即选出�ơ大的元素。由于这两个儿子之间的大��关�p�L��很不��定的，两者都很大�Q�说不好哪个更大哪个更小�Q�所以这�ơ比较的两个�l�果��是概率均等的了。具体参�?span lang=EN-US>�q�里�?

3.2 ��Z��么快排其实也不是那么�?

我们考虑快排的过�E�：随机选择一个元素做“轴元�?span lang=EN-US>”�Q�将所有大于��u元素的移到左边，其余�U�d��双��。根据这个过�E�，快排的第一�ơ比较就是将一个元素和轴元素比较，�q�个时候显而易见的是，“大于”�?span lang=EN-US>“��于”的可能性各占一半。这是一�ơ漂亮的比较�?

然而，快排的第二次比较��׃��那么高明了：我们不妨令��u元素�?span lang=EN-US>pivot�Q�第一�ơ比较结果是a1�Q�那么可以证明第二次比较a2也小�?span lang=EN-US>pivot的可能性是2/3�Q�这�Ҏ��证明�Q�如�?span lang=EN-US>a2>pivot的话�Q�那�?span lang=EN-US>a1�Q?span lang=EN-US>a2�Q?span lang=EN-US>pivot�q�三个元素之间的关系��完全确定了——a1�Q�剩下来的元素排列的可能性我们不妨记�?span lang=EN-US>P�Q�不需要具体算出来�Q�。而如�?span lang=EN-US>a2呢？那么a1�?span lang=EN-US>a2的关�p�d��仍然是不��定的，也就是说�Q�这个分支里面含有两�U�情况：a1�Q�以�?span lang=EN-US>a2。对于其中�Q一�U�情况，剩下的元素排列的可能性都�?span lang=EN-US>P�Q�于是这个分支里面剩下的排列可能性就�?span lang=EN-US>2P。所以当a2的时候，�q�剩�?span lang=EN-US>2/3�?nbsp; 可能性需要排查�?

再进一步，如果�W�二步比较果真发�?span lang=EN-US>a2的话�Q�第三步比较��更不妙了，模仿上面的推理，a3的概率将会是3/4�Q?

�q�就是快排也不那么快的原因，因�ؓ它也没有做到每次比较都能��剩下的可能性砍掉一半�?

3.3 鸡排��Z��么又那么快呢�Q?

传统的解释是�Q?span lang=EN-US>基排不是��Z��比较的，所以不��h��后者的局限性。话是没错，但其实还可以��它和基于比较的排序做一个类比�?

基排的过�E�也许是源于我们理顺一副牌的过�E�：如果你有N�Q?span lang=EN-US>N<=13�Q�张牌，乱序�Q�如何理��呢�Q�我们假象桌上有十三个位�|�，然后我们��手里的牌一张一张放出去�Q�如果是3�Q�就攑֜�位置3上，如果�?span lang=EN-US>J�Q�就攑֜�位置11上，攑֮�了之后从位置1��C��|?span lang=EN-US>13攉��所有的牌（没有牌的位置上不攉��M��牌）�?

我们可以�q�样来理解基排高效的本质原因�Q�假讑։�i张牌都已�l�放��C��它们对应的位�|�上�Q�第i+1张牌攑և��ȝ��时候，实际上就相当�?span lang=EN-US>“一下子”��q��立了它和�?span lang=EN-US>i张牌的大��关�p�，�?span lang=EN-US>O(1)的操作就��这张牌正确地插入到了前i张牌中的正确位置上，�q�个效果��q��当于插入排序的第i轮原本需要比�?span lang=EN-US>O(i)�ơ的�Q�现在只需�?span lang=EN-US>O(1)了�?

但是�Q��ؓ什么基排能够达到这个效果呢�Q�上面只是解释了�q�程�Q�解释了�q�程不代表解释了本质�?

�?span lang=EN-US>i张牌攑ֈ�位之后，攄��W?span lang=EN-US>i+1张牌的时候有多少�U�可能性？大约i+1�U�，因�ؓ�?span lang=EN-US>i张牌��?span lang=EN-US>13个位�|�分割成�?span lang=EN-US>i+1个区�?span lang=EN-US>—�?/span>�W?span lang=EN-US>i+1张牌可以落在��L��一个区间。所以放�|�第i+1张牌��好比是询问�q�样一个问题：“�q�张牌落在哪个区间呢�Q?span lang=EN-US>”而这个问题的�{�案�?span lang=EN-US>i+1�U�可能性？所以它��将剩下来的可能性均分成�?span lang=EN-US>i+1份（换句话说�Q�砍掉了i/i+1的可能性！�Q�。再看看��Z��比较的排序吧�Q�由于每�ơ比较只有两�U�结果，所以最多只能将剩下的可能性砍掉一半�?

�q�就是�ؓ什么基排要快得多。而所有基于比较的排序都逃脱不了NlogN的宿命�?

4. 信息论！信息论？

本来呢，MacKay写那��文章是想用信息论来解释��Z��么堆排慢�Q�以及�ؓ什么快排也慢的�?span lang=EN-US>MacKay在他的文章中的解释是�Q�只有提出每�U�答案的概率都均�{�的问题�Q�才能获得最大信息量。然而，仔细一惻I��其实�q�里信息论�ƈ不是因，而是果。这里不需要用信息论就完全能够解释�Q�而且更明白。信息论只是对这个解释的一个�Ş式化。当�Ӟ��信息论在其它地方�q�是有应用的。但�q�里其实用不着信息��么重量��的东西（也许具体计算一些数据的时候是需要的�Q�，而是只需要一�U�看问题的本质视角：��排序问题看成和猜数字一��P��是通过问问题来�~�小/排除�Q?span lang=EN-US>narrow down�Q�结果的可能性区��_��q�样一来，��׃��发现�Q?span lang=EN-US>“最好的问题”��是那些能够均分所有可能性的问题�Q�因为那��L��话不��问题的�{�案如何�Q�都能排除掉k-1/k�Q?span lang=EN-US>k为问题的�{�案有多��种输出—�?/span>猜数字里面是2�Q�称球里面是3�Q�种可能性，而不均衡的问题��M��有一个或一些答案分支排除掉的可能性要��于k-1/k。于是策略的下界��p��拖篏了�?

5. ��结

�q�的��是“��结”�Q�因��Z��点：

1. �q�个问题可以有信息论的理��释，而信息论则是一个相当大的领域了�?span lang=EN-US>

2. 文中提到的这�U�看问题的视角除了用于排序、称球，�q�能够运用到哪些问题上（比如搜烦�Q��?span lang=EN-US>

Update(06/13/2008) : 徐宥在讨��Z��l�箋提到�Q?span lang=EN-US>

另外�Q�这几天我重新把TAOCP �W�三�?span lang=EN-US>(�W�二�?span lang=EN-US>)��d��来看了看 Knuth 怎么说这个问题的, 发现真是牛大了：

先说性能�Q?

pp148, section 5.2.3 ��_��

When N = 1000, the approximate average runiing time on MIX are 160000u for heapsort 130000u for shellsort 80000u for quicksort

�q�里, Knuth 同学发现一般情况下 heapsort 表现很不�?span lang=EN-US>. 于是�Q�在下文他就��_��习题18 (pp156, 隑ֺ�21)

(R.W.Floyd) During the selection phase of heapsort, the key K tends to be quite small, so that nearly all the comparisons in step H6 find K

�{�案里面的方法和DMK的方法是一��L��?span lang=EN-US>(我觉�?span lang=EN-US>DMK是看了这个论文或�?span lang=EN-US>TAoCP�?span lang=EN-US>) �q�里�?span lang=EN-US> by half�Q�就正好和快排差不多了�?

再说信息论分析：

�?span lang=EN-US>5.3.1 (pp181) 高爷爷就�?span lang=EN-US>, “排序问题可以看成是一个树上的鸟儿排排站的问题. (�q�特地画了一��|��), 下一�D�就�?span lang=EN-US>, 其实�q�个也有�{��h说法, ��是信息�?span lang=EN-US>, 我们从称球问题说�?span lang=EN-US>...”

然后后面一直讲信息论和最��比较排�?span lang=EN-US>...

高爷��L��不愧是姓高的�Q�囧rz..

漂漂 2008-11-21 19:07 发表评论

漂漂 — Sat, 15 Nov 2008 08:37:00 GMT

�W�一个问题我觉得我无法给出完��的�{�案�Q�这里搞竞赛的牛��多，不妨说说体会:D

我个��得算法里面极大一部分内容是如何有效地�q�行搜烦�Q�这里的"有效"可以分�ؓ�Q�避免不必要的计��（如A*寻�\以及所有的启发式剪枝）�Q�缓存重复计��（如所�?shy;的动态规划）。当�Ӟ��知道�q�些跟具体的设计��Z��个算法至��还有十万八千里�Q�只能说有了�q�个大体的思�\�Q�就可以从这两个角度��d��视手头的问题�Q�往往是会有启发意�?shy;的�Ş了。如何避免不必要的计��？也有很多 rules of thumb 可以遵��@�Q�如启发式剪枝里面就要求去设计一个最优下界，而最一般的思�\则是使劲瞅瞅问题里面有什么条件是没有利用的，�q�些条�g�l�合��h��可以得出什么性质�Q�也许某个性质��p��够被利用来减掉一大堆计算�Q�至于如何从题目条�g推出有�h值的性质�Q�有两个办法�Q�一是试错（惛_��的结论都�l�写出来�Q�陶哲轩�?Solving Mathematical Problems 里面��提到过�q�个办法。）�Q�另一个方向则是脑袋里揣着惌��实现的目的往反方向归�U�。如何缓存重复计��？��单的动态规划问题如fibonacci数列计算�Q�其重复计算是非常明昄��Q�计��的�q�程本��n��指明了哪些计算是重复的�Q�An ��的计算是重复的�Q�——当�Ӟ��正如早前邓同学发的一个题�?lt;https://groups.google.com/group/pongba/browse_frm/thread/2ca1f2bda0c8...>里面说的�Q�其实fibonacci数列计算里面的线性变换本�w�也是有重复计算的——后者便是更隐蔽的重复计��了�Q�一�?non-trivial 的动态规划问题往往涉及到非帔R��蔽的重复计算�Q�或者更隄��是，你遍历组合空间的方式军_��了你所能够�~�存的重复计��到底有多少�Q�也许某个遍历方式之下就没有办法�?shy;�~�存计算。当�Ӟ��法的范畴其实是很大的，��法是一个AI-Complete 的问题，所有的 Problem-Solving �q�程都可以叫做算法。只是有很多实际当中的算法会掉入以上两类而已�?nbsp;

�W�二个问题我举一个例子：不像很多牛�h在高中和本科��q��赛奖牌一堆，我直到大四的时候还不知道什么是动态规划，因�ؓ本科四年我一直只对底层技术感兴趣�Q�最喜欢�?比如 Petzold 的《编码的奥秘》和 Richter 的�?NET 框架�E�序设计》（事实上这是我看的�W�一本英文原版书�Q�这�c�M��。研一的时候由于方向是自然语言处理�Q�看的第一��?paper �?Rabiner �? A Tutorial on Hidden Markov Models and Selected Applications in Speech
Recognition 。Paper 的内容倒是完全能够理解�Q�但是理解其实只是第一步，我发现理解了之后很快��忘掉了�Q�这��p��明理解得不够深刻。比如里面的 Viterbi ��法�Q�花了时间去理解�Q�但是一转头很快又忘掉了。一�q�后因�ؓ机缘巧合�Q�对��法发生了一�D늟�暂的兴趣�Q��ƈ学习了一些基��的算法，��其是算法的思想�Q�因为思想是有�I?shy;的，但算法是无穷的，��其是题目是做不完的。之后一�D�|��_��y又需要翻一��马可夫模型�Q�搜出吴军的数学之美以及那篇 Paper �Q�发�?Viterbi ��法其实��是最��单的一�c�d��态规划，�׃��对于动态规划的理解深刻了很多，所以对�?Viterbi ��法�Q�在脑袋里面��C��的不再是什�?Forward Variable/Backward Variable
之类的技术细节，而是它的本质�Q�于是便不再�Ҏ��忘掉�Q�而即便忘掉，��如庞加莱所��_��也可以非常迅速的��算法的�l�节自行构徏出来�?

其实我相信这��L��例子是数不胜数的�Q�所以我�q�个只是��一�?Yet Another Example �Q�由于对我来说比较特�D�，所以印象较为深刅R�?

�q�个例子是关�?理解"的。有时候算法也会非常有用，如有一�ơ写�E�序旉��要用�?LCS �?Edit-Distance �Q�这��L��Z��很少�Q�但遇到了时如果不知道有多项式复杂度的算法就很悲惨了�Q�，而做机器学习和数据挖掘的更是��不了一坨坨的算法，如果光是理解别�h的做法然后实�?shy;出来�Q�那么对��法的思想的把握有助于理解和记忆；如果需要自��p��计算法，那就需要算法基��知识的辅助才行了。绝大多��C�h应该属于前者�?

学习��C��么程度？我觉得视人群而定。如果做底层开发、应用开发、系�l�开发，只要知道一个大概就可以了，知道�l�典的数据结构和��法没有��M��困难�Q�而且反正�l�典��法都有现成的库可用。对于有兴趣做一�?research 沾边的事情的人，则需要了解这些算法背后的一般性思�\是什么，否则来一个特定的��法你就特定的理解记忆一下，肯定不牢靠，而且��费大脑资源。对于搞 real deal �?original research 的那��需要广泛的知识�U�篏了，光知道一般性思�\都不够�?

另一斚w��Q�我觉得学完了经典算法，深刻理解了算法背后的一般性思�\之后�Q�如果再�q�一步去玩题目，做题库。效益却不是很大的，因�ؓ刀��了是要用的�Q�玩题目做题库就是进一步磨刀而不用（不去解决实际问题�Q�能够��生媄响力的，或生产力的问题）。实际上做了一些题目之后就完全没必要进一步做题目了，因�ؓ做来做去�Q�拼的基本也��?shy;是谁的知识积累多�Q�套路多�Q�，谁的耐心大（肯��劲去��一道题目）�Q�实际上谁也不比谁笨�Q�到最后区别就基本上显露在知识�U�篏和耐心上了。所以接着做，刀也不会磨�?shy;更锋利，更何况大好的时光应该��d��Ҏ��意义的事情（如果是�ؓ�?fun 而做题的�Q�那么有意义的事情同样也可以�?extremely fun�Q�，比如我觉得最吸引��Z��最�Ҏ��的问题就是�h工智能问题（��x��看，��是世界上�q�今为止所知最为复杂的�l�构�Q�这个结构具备了认识自然�?规律"的能力，�?shy;备了认识"自我"的能力，具备了归�U�_��演绎推理的能力，�c�L��的能力，具备了难以置信的启发式搜索能力，具备完美的模式识别能力，而根据进化论的观点，�q�样的结�?shy;居然仅仅是通过变异——筛选得来的�Q�如果真有上帝，那么利用上帝赋予我们的大脑去破解上帝�q�个��牛逼程序员写的�E�序——�h脑的�U�密�Q�还有比�q�更带劲儿的事情�?shy;�Q�）�Q�所以我觉得有那么好的基��的牛人，不去直面真正 fundamental �?problems �Q�就可惜了，��ȝ��题目是永�q�做不完的，一个公理系�l�的定理也是永远推导不完的，永远可以设计出题目来�l�你做，但是真正的问题其实只有一个。如果穷举不了世界上所有的问题�Q�至��可以�D出那些有��、有意义的问�?)

--
刘未�?pongba)
Blog|C++的罗��宫
http://blog.csdn.net/pongba

漂漂 2008-11-15 16:37 发表评论

欧美一二区视频,中日韩美女免费视频网站在线观看,老牛国产精品一区的观看方式

在windows中编译sphinx1.10beta--coreseek(�c�M��)(���译)

协同推荐���法实践之Slope One的介�l�（转）

A*寻�\初探(�?

�U�黑树（Red-Black Tree�Q?�?

数学之美番外���：快排��Z��么那样快(转）

在windows中编译sphinx1.10beta--coreseek(�c�M��)(��译)

协同推荐��法实践之Slope One的介�l�（转）

数学之美番外��：快排��Z��么那样快(转）