亚洲香蕉伊综合在人在线视看,欧美日韩另类视频,国产精品青草久久久久福利99

深入getmessage和peekmessage

Thu, 14 Sep 2006 10:18:00 GMT

摘要: bob gunderson msdn 技术组作于 :1992 �q? 11 �? 11 �? ... 阅读全文

爱饭�?/a> 2006-09-14 18:18 发表评论

Thu, 07 Sep 2006 14:32:00 GMT

3. recv和W S A R e c v
对在已连接套接字上接受接入数据来��_�� r e c v函数是最基本的方式。它的定义如下：

int recv(
     SOCKET s,
     char FAR * buf,
     int len,
     int flags
    );
�W�一个参数s�Q�是准备接收数据的那个套接字。第二个参数b u f�Q�是卛_��收到数据的字�W�缓�Ԍ��而l e n则是准备接收的字节数或b u f�~�冲的长度。最后， f l a g s参数可以是下面的��|�� 0、M S G _ P E E K或M S G _ O O B。另外，�q�可对这些标志中的每一个进行按位和�q�算。当�Ӟ�� 0表示无特�D�行为。M S G _ P E E K会��有用的数据复制到所提供的接收端�~�冲内，但是没有从系�l�缓
冲中��它删除。另外，�q�返回了待发字节数�?br />消息取数不太好。它不仅��D��性能下降�Q�因为需要进行两�ơ系�l�调用，一�ơ是取数�Q�另一�ơ是无M S G _ P E E K标志的真正删除数据的调用�Q�，在某些情况下�q�可能不可靠。返回的数据可能没有反射出真正有用的数量。与此同�Ӟ��把数据留在系�l�缓�Ԍ��可容�U�x��入数据的�pȝ��I�间��׃��来��少。其�l�果便是�Q�系�l�减��各发送端的T C P�H�口定w��。由此，你的应用��׃��能获得最大的��通。最好是把所有数据都复制到自��q��~�冲中，�q�在那里计算数据。前面曾介绍�q�M S G _ O O B标志。有兌��情，参见前面“带外数据”的内容�?/p>

在面向消息或面向数据报的套接字上使用r e c v�Ӟ��q�几点应该注意。在待发数据大于所提供的缓冲这一事�g中，�~�冲内会��量地填充数据。这�Ӟ�� r e c v调用��׃��产生W S A E M S G S I Z E错误。注意，消息镉K��误是在��用面向消息的协议时发生的。流协议把接入的数据�~�存下来�Q?br />�q�尽量地�q�回应用所要求的数据，即��待发数据的数量比�~�冲大。因此，�Ҏ��式传输协议来��_��׃��会碰到W S A E M S G S I Z E�q�个错误�?br />W S A R e c v函数在r e c v的基��上增加了一些新�Ҏ��。比如说重叠I / O和部分数据报通知�?br />W S A R e c v的定义如下：

int WSARecv(
       SOCKET s,
       LPWSABUF lpBuffers,
       DWORD   dwBufferCount,
       LPWORD lpNumberOfBytesRecved,
       LPWSAOVERLAPPED lpOverlapped,
       LPWSAOVERLAPPED_COMPLETION_ROUTINE lpCompletionROUTINE
      );

参数s�Q�是已徏立连接的套接字。第二和�W�三个参数是接收数据的缓册Ӏ�l p B u ff e r s参数是一个W S A B U F�l�构�l�成的数�l�，而d w B u ff e r C o u n t则表明前一个数�l�中W S A B U F�l�构的数目�?br />如果接收操作立即完成�Q?l p N u m b e r O f B y t e s R e c e i v e d参数��׃��指向执行�q�个函数调用所收到的字节数。l p F l a g s参数可以是下面�Q何一个��|�� M S G _ P E E K、M S G _ O O B、M S G _ PA RT I A L或者对�q�些��D��行按位和�q�算之后的结果。M S G _ PA RT I A L标志使用和出现的地方不同�Q�其�?br />义也不同。对面向消息的协议来��_��q�个标志是W S A R e c v调用�q�回后设�|�的�Q�如果因为缓冲空间不够导致整条消息未能在�q�次调用中返回的话）。这�Ӟ��后面的W S A R e c v调用��׃��讄��q�个标志M A S G _ PA RT I A L�Q�直到整条消息返回，才把�q�个标志清除。如果这个标志当作一个输入参数投递，接收操作应该在一收到数据��q��束，即��它收到的只是整条消息中的一部分�?br />M S G _ PA RT I A L标志只随面向消息的协议一起��用。每个协议的协议条目都包含一个标志，表明是否支持�q�一�Ҏ��。有兌��情，参见�W?章。l p O v e r l a p p e d和l p C o m p l e t i o n R O U T I N E参数用于重叠I / O操作

4. WSARecvDisconnect
�q�函��C��W S A S e n d D i s c o n n e c t函数对应�Q�其定义如下�Q?br />int WSARecvDisconnect(
            SOCKET s,
            LPWSABUF lpOUTboundDisconnectData
           );
和W S A S e n d D i s c o n n e c t函数的参��C��P��该函数的参数也是已徏立连接的套接字句柄和
一个有效的W S A B U F�l�构�Q�带有收到的数据�Q�。收到的数据可以只是断开数据。这个断开数据是另一端执行W S A S e n d D i s c o n n e c t调用发出的，它不能用于接收普通数据。另外，一旦收到这个数据， W S A R e c v D i s c o n n e c t函数��׃��取消接收�q�程通信方的数据�Q�其作用和调用带有S D _ R E C V的s h u t d o w n函数相同�?br />5. WSARecvEx
W S A R e c v E x函数是微软专有的Winsock 1扩展�Q�除了f l a g s参数是按值引用外�Q�其余和r e c v函数是一��L��。它允许基层的提供者设�|�M S G _ PA RT I A L标志。该函数的原型如下：

int PASCAL FAR WSARecvEx(
             SOCKET s,
             char FAR * buf,
             int len,
             int * flags
            );

如果收到的数据不是一条完整的消息�Q?f l a g s参数中就会返回M S G _ PA RT I A L标志。对面向消息的协议（即非��协议）来说�Q�这个标志比较有用（即非��协议）。在M S G _ PA RT I A L标志被当作f l a g s参数的一部分投递，而且收到的消息又不完整时�Q�调用W S A R e c v E x�Q�就会立�?br />�q�回收到的那个数据。如果提供的接收�~�冲容纳不下整条消息�Q?W S A R e c v E x��׃��p�|�Q��ƈ出现W S A E M S G S I Z E 错误�Q�剩下的数据也会被截掉。注意， M S G _ PA RT I A L 标志和W S A E M S G S I Z E错误之间的确区别是：有了�q�个错误�Q�即使整条消息到达接收端�Q�但�׃��?br />供的数据�~�冲太少�Q�也不能对它�q�行接收。M S G _ P E E K 和M S G _ O O B标志�q�可以和W S A R e c v E x一起��用�?/p>

爱饭�?/a> 2006-09-07 22:32 发表评论

Tue, 05 Sep 2006 11:31:00 GMT

�W?章重定向�?br /> 首先�Q�我们打��解释如
何通过�|�络�Q��用“多U N C提供者”（ Multiple UNC Provider, MUP�Q�资源定位符�Q�通过“通用命名规范”（Universal Naming Convention, UNC�Q�来引用�q�程文�g�?/p>

随后�Q�我们讲解了M U P如何调用一个网�l�提供者，从而揭�C�出怎样通过一个重定向器，在“服务器消息块”（Server Message Block, SMB�Q�协议的帮助下，在不同的计算��Z��间徏立数据通信�?/p>

最后，我们探讨了网�l�安全方面的一些问题。��用基本的文�gI / O操作�Q�通过�|�络来访问文件时�Q�这些安全问题是必须考虑到的�?/p>

2.1 通用命名规范

“U N C路径�? 为网�l�文件及讑֤�的访问徏立了一套统一的规范。它最大的特点便是不必指定或引用一个已映射到远�E�文件系�l�的本地驱动器字母�?/p>

U N C名字完全解决了这些问题，它的格式如下�Q?br />\ \ [服务器] \ [�׃�n名] \ [路径]
�W�一部分是\ \ [服务器]�Q�必��M��两个反斜杠开��_��紧跟着一个服务器名字�?br />�W�二部分是\ [�׃�n名]�Q�它对应着�q�程服务器上的一个“共享入口”或者“共享位�|�”�?br />。而第三部分\ [路径] 对应的是�׃�n位置下的某个具体目录�Q�或子目录）

�W?章邮�?/p>

一�U�简单的单向“进�E�间通信”（interprocess communication,I P C�Q�机制。这个机制的名字非常古怪，叫作“邮槽”（M a i l s l o t�Q�。用最��单的话来��_��通过
邮槽�Q�客��h��q�程可将消息传送或�q�播�l�一个或多个服务器进�E�。在同一台计��机的不同进�E�之��_��或在跨越整个�|�络的不同计��机的进�E�之��_��协助�q�行消息的传输。用邮槽来开发应用程序是一仉��常简单的事情�Q�不要求对T C P / I P或I P X�q�样的基层网�l�传送协议有着非常深入的了解。由于邮槽是围绕一个广播通信体系设计出来的，所以当然不能指望能通过它实现数据的“可靠”传输�?/p>

邮槽最大的一个缺点便是只允许从客��h��到服务器�Q�徏立一�U�不可靠的单向数据通信�?br />而另一斚w��Q�邮槽最大的一个优点在于，它们使客��h��应用能够非常�Ҏ��地将�q�播消息发送给一个或多个服务器应用�?/p>

3.1 邮槽实施�l�节
邮槽是围�l�Wi n d o w s文�g�pȝ��接口设计出来的。客��h��和服务器应用需要��用标准的Wi n 3 2文�g�pȝ��I / O�Q�输入／输出�Q�函敎ͼ�比如R e a d F i l e和Wr i t e F i l e�{�等�Q�以便在邮槽上收发数据，同时利用Wi n 3 2文�g�pȝ��的命名规则。邮槽必��M��赖Wi n d o w s重定向器�Q�通过一个“邮槽文件系�l�”（Mailslot File System, MSFS�Q�，来创建及标识邮槽�?/p>

3.1.1 邮槽的名�?br />寚w��槽进行标识时�Q�需遵守下述命名规则�Q?br />\ \ s e r v e r \ M a i l s l o t \ [ p a t h ] n a m e
请将上述字串分�ؓ三段来看�Q?\ \ s e r v e r、\ M a i l s l o t和\ [ p a t h ] n a m e。第一部分\ \ s e r v e r对应于服务器的名字，我们要在上面创徏邮槽�Q��ƈ在在上面�q�行服务器程序。第二部分\ M a i l s l o t是一个“硬�~�码”的固定字串�Q�用于告诉系�l�这个文件名从属于M S F S。而第三部分\ [ p a t h ] n a m e�?br />允许应用�E�序独一无二地定义及标识一个邮槽名。其中，“p a t h”代表�\径，可指定多�U�目录�?br />举个例子来说�Q�对一个邮槽进行标识时�Q�下面这些�Ş式的名字都是合法的（注意M a i l s l o t不得变化�Q�必��d��文照输，亦即所谓的“硬�~�码”）�Q?br />�׃��邮槽要依赖Wi n d o w s文�g�pȝ��服务在网上来创徏和传输数据，所以接口是“与协议无关”的�?br />要想保证各种Wi n d o w s�q�_��之间能够完全正常地通信�Q�强烈徏议将消息长度限制�? 2 4字节�Q�或者更短。如果进行面向连接的传输�Q�可考虑使用命名��道�Q�而不是简单的邮槽�?/p>

3.5 ��结
本章讲解了邮槽（ M a i l s l o t�Q�网�l�编�E�技术。利用这一技术，应用�E�序可以在Wi n d o w s重定向器的帮助下�Q�实现简单的单向�q�程间数据通信。对邮槽来说�Q�它最有�h值的一��功能便是通过�|�络�Q�将一条消息广播给一台或多台计算机。然而，邮槽�q�未提供�Ҏ��据可靠传输的保障。假如希望用Wi n d o w s重定向器实现“可靠”的数据通信�Q�请考虑使用命名��道�Q�这是下一章的主题�Q?/p>

爱饭�?/a> 2006-09-05 19:31 发表评论

windows �|�络�~�程

Tue, 05 Sep 2006 08:46:00 GMT

1、netBIOS
非可路由协议
LAN适配器（LAN adapter�Q�编号很重要.
每个LANA�~�号对应于网卡和传输协议的唯一�l�合�?/p>

netBIOS名字
在Wi n 3 2环境中，针对每个可用的L A N A�~�号�Q�每
个进�E�都会�ؓ其维持一张N e t B I O S名字表。若为LANA 0增添一个名字，意味着你的应用�E�序
只能在LANA 0上同客户机徏立连接。对每个L A N A来说�Q�能够添加的名字的最大数量是2 5 4�Q?br />�~�号�?�? 5 4�Q?�? 5 5��q��l�保留）
�Q�N e t B I O S名字共有两个性质�Q�唯一名字和组�?br />微��Y�|�络中的机器命名��是NetBIOS命名�?br />“组名”的作用是将数据同时发给多个接收者；或者相反，接收发给多个
接收者的数据。组名�ƈ非一定要“独一无二”，它主要用于多播（多点发送）数据通信
若有“windows互联�|�命名服务器”即wins�Q�则有它��理�Q�若无则发广播探��是否重名�?/p>

1.1.3 NetBIOS�Ҏ�?/p>

N e t B I O S同时提供了“面向连接”服务以及“无�q�接”服务�?/p>

1.2 NetBIOS�~�程基础
NetBIOS API的设�|�，只有一个函敎ͼ�
UCHAR Netbios(PNCB pNCB);

用于N e t B I O S的所有函数声明、常数等�{�均是在头文件N b 3 0 . h内定义的。若惌��?br />N e t B I O S应用�Q�唯一需要的库是N e t a p i 3 2 . l i b�?br />调用N e t b i o s函数�Ӟ��可选择�q�行同步调用�Q�还是进行异步调用。所有N e t B I O S命��o本��n均是同步的。要惛_��步调用一个命令，需要让N e t B I O S命��o同A S Y N C H标志�q�行一�ơ逻辑O R�Q�或�Q�运��。如指定了A S Y N C H标志�Q�那么必��d��n c b _ p o s t字段中指定一个后例程�Q�Post Routine�Q�，或必��d��n c b _e v e n t字段中指定一个事件句柄。执行一个异步命令时�Q�从N e t b i o s�q�回的值是N R C _ G O O D R E T( 0 x 0 0 )�Q�但n c b _ c m d _ c p l t字段会设为N R C _ P E N D I N G ( 0 x F F )。除此以外， N e t b i o s函数�q�会��N C B�l�构的n c b _ c m d _ c p l t字段设�ؓN R C _ P E N D I N G�Q�待冻I��Q�直到命令完成�ؓ止。命令完成后�Q�n c b _ c m d _ c p l t字段会设��命��o的返回倹{��N e t b i o s也会在完成后��n c b _ r e t c o d e字段设�ؓ命��o的返回倹{�?br />

1.4 数据报的工作原理

“数据报”（D a t a g r a m�Q�属于一�U�“无�q�接”的通信�Ҏ��。作为发送方�Q�只需用目�?br />N e t B I O S名字为发出的每个包定址�Q�然后简单地送出了事。此�Ӟ��不会执行��M��查，以确
保数据的完整性、抵��N��序或者传输的可靠性等�{��?/p>

发出一个数据报共有三种方式�?br />�W�一�U�是指挥数据报抵达一个特定的�Q�或唯一的）�l�名。这意味着只能有一个进�E�负责数据报的接收—亦��x��册了目标名字的那个进�E��?br />�W�二�U�是��数据报发给一个组名。只有注册了指定�l�名的那些进�E�才有权接收消息�?br />最后，�W�三�U�方式是��数据报�q�播到整个网�l��?/p>

爱饭�?/a> 2006-09-05 16:46 发表评论

Rich Client技术简�?4

Tue, 18 Apr 2006 04:52:00 GMT

Flex官方说法如下�Q�摘自网�l�上相关文章�Q?

原代号�ؓ“Royale”的MacromediaFlex软�g��把服务器��Y件、开发指南和其他工具�l�合在一��P��使传�l�的�|�络应用开发�h员能够用Macromedia公司的Flash格式创作软�g单元。如从前报道的那��P��该��品的重点是让那些使用Sun微系�l�公司的Java2企业�?J2EE)的开发�h员能够创作出更有吸引力、更�Ҏ��D��的J2EE应用软�g接口�?o:p>

Flex��J2EE开发�h员��用标准的文本式开发工��h��制作Flash应用�E�序�Q�而不必��用Macromedia公司以前出售的复杂的设计工具。Macromedia公司从今�q�年初开始，努力扩大Flash格式对于��L��开发商的吸引力�Q�其目标是扩大Flash的用途，使其成�ؓ提供互联�|�应用和建立交互式网站的基础�?o:p>

Macromedia公司计划�?004�q�上半年推出Flex服务器��Y�Ӟ��该��Y件的��h��目前�q�没有确定。它的初�U�版本将�q�行于J2EE中，�q�计划随后推出支持微软的.Net格式的版本。最初的支持者包括IBM公司�Q�它��随自己的WebSphere软�g一��h��q�Flex的应用�?

需要了解更多Flex技术的朋友可以讉K��Flex的主��：

http://www.macromedia.com/software/flex/

Thinlet

Thinlet是一个采用Applet解析XUL�q�提供相应界面的解析器，在事件发生时�Q�调用用戯��q��事�g处理�E�序(java �E�序)�Q�需要客��L��览器支持Applet。更多信息可以参考　http://www.thinlet.com/

爱饭�?/a> 2006-04-18 12:52 发表评论

Rich Client技术简�?3

Tue, 18 Apr 2006 04:50:00 GMT

Hessian�Q�http://www.caucho.com�Q�是由Resin应用服务器的开发商Caucho公司制定的一个RPC协议�Q�虽然它也是通过HTTP协议传输RPC��包�Q�但是它的RPC��包却是以二�q�制形式�~�码的，而且能够表现对象模型和异�怽��p�，�q�就使得Hessian�?a class="Channel_KeyLink" >XML-RPC��h��更高的效率�??XML:NAMESPACE PREFIX = O /?>

具体通信机制资料误��者参考网上内容和透明�?004�q?期《程序员》杂志中《王朝复辟还是�ʎ火重生》一文�?o:p>

Rich Client 开源开发��^�?/b> Laszlo

Laszlo是一个开源的Rich client开发环境。��用Laszlo�q�_��Ӟ��开发者只需�~�写名�ؓLZX的描�q�语�a��Q�其中整合了XML和JavaScript�Q�，�q�行在J2EE应用服务器上的Laszlo�q�_��会将其编译成FLASH文�g�q�传输给客户端展�C�。单从运行原理来��_��Laszlo与XUL�Q?a class="Channel_KeyLink" >XML用户接口语言�Q� �?XML User interface Language�Q�、XAML�Q�“Longhorn”）标记语言很类伹{��但它的最大优势在于：它把描述语言�~�译成FLASH�Q�而FLASH是�Q何浏览器都支持的展示形式�Q�从而一举解决了��览器之间的�U�L��问题。而且�Q�在未来的计划中�Q�Laszlo�q�可以将LZX�~�译成Java�?NET本地代码�Q�从而大大提高运行效率�?o:p>

具体请参考http://www.openlaszlo.org�?o:p>

IBM AlphaWorks�|�站�q�日发布了用于开发Laszlo应用�E�序的集成开发环境（实际上是一个Eclipse插�g�Q�，使J2EE开发者能够在他们熟悉的Eclipse环境中快速开发基于Laszlo的rich client应用�E�序。可以在下列地址下蝲该插�Ӟ��

http://alphaworks.ibm.com/tech/ide4laszlo

此外�Q�AlphaWorks�|�站�q�提供了一个用Laszlo开发的�C�Z��应用�Q�展�C�Z��在Eclispe环境下开发Laszlo应用的过�E�。demo的地址如下�Q?o:p>

http://dl.alphaworks.ibm.com/technologies/rcb/demo.html

FLEX

Flex是Macromedia公司开发的�Q�用于Rich client开发的环境�Q�其原理是将MXML(the Macromedia Flex Markup Language)文�g�Q�编译成SWF文�g�Q�然后显�C�在��览器中,�q�利用Web Service技术和服务器通信。从而利用Flash的强大功能，带来更丰富的用户体验�?/p>

爱饭�?/a> 2006-04-18 12:50 发表评论

Rich Client技术简�?2

Tue, 18 Apr 2006 04:47:00 GMT

RMI可以是做CORBA的Java版本�Q�但相比较而言�q�是一个轻量��的版本了�Q�对于服务器和客��L��两边都用Java来实现的前提下，�q�是一个非常好的选择�??XML:NAMESPACE PREFIX = O /?>

CORBA和RMI有一个共同的�~�陷�Q�通常不会在系�l?0端口提供服务�Q�所以这在具备网�|�防火墙的情况下昑־�非常被动�?o:p>

XML-RPC

��Z��解决在系�l�的80端口提供RPC的服务，而又不媄响正在执行的WEB服务�Q��h们想��Z��用HTTP协议传输RPC包的办法。对于几乎是专门用于传输文本的HTTP协议�Q�要在其上传输RPC��包�Q�最方便的方法莫�q�于把RPC��包�~�码成文本�Ş式——例�?a class="Channel_KeyLink" >XML文�g�?o:p>

XML-RPC�Q�http://www.xml-rpc.com�Q�是��q��国UserLand公司指定的一个RPC协议。它��RPC信息��包�~�码�?a class="Channel_KeyLink" >XML�Q�然后通过HTTP传输��包�Q�它是一个简单的RPC协议�Q�只支持一些基本数据类型，不支持对象模型，�q�势必掣肘在客户端和服务器端之间传输复杂的对象�?o:p>

SOAP

      SOAP即Simple Object Access Protocol(��单对象访问协�?是在分散或分布式的环境中交换信息的简单的协议�Q�是一个基�?a class="Channel_KeyLink" >XML的协议。它允许所有的操作�?0端口上进行，从而也�l�过了防火墙�{�问题�?o:p>

　　SOAP规范中有三个基本�l�成部分�Q�SOAP��装�Q�编码规则，以及在请求和响应之间的交互方式�?o:p>

　　目前已有的基于JAVA提供SOAP功能的��品有�Q�Apache SOAP, IBM SOAP4J�{?o:p>

    要了解更多关于SOAP的信息，可以讉K�� http://www.w3.org/TR/SOAP

爱饭�?/a> 2006-04-18 12:47 发表评论

Tue, 18 Apr 2006 04:36:00 GMT
传统的基于C/S的Windows应用�E�序��L��让客户面临着一些感觉很是不爽的问题�Q�如�Q�部�|�问题、升�U�困难、维护困难、安全问题，但是完全的WEB开发由于HTTP协议的无状态特性——浏览器和服务器��L��在不停地执行Request和Response来营造一�U�有状态、持�l�会话的假象�Q�致使�h们又开始怀恋具有更��能力、本地存储能力和更稳定的通讯能力的客��L��E�序了�??xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /?>
不得不说的是�Q�宽带网�l�的出现在某�U�意义促成了Rich Client的诞生。通过快捷的发布，特定的通讯协议标准�Q�Rich Client正以不可��L��的气势向��Z��重现着C/S模式下客��L��E�序的优�ѝ�?o:p>
Rich Client的发�?/b>
C/S架构下，客户端程序发布与�l�护一直比较困隑֒��J�琐。在版本更新以后�Q�需要对客户的客��L��E�序�q�行逐个下蝲安装及配�|�更斎ͼ��q�是一个体力活�Q�而这也一直是使用户大量选择WEB�E�序的因素之一�?o:p>
在Rich Client时代�Q�由于宽带网�l�的便利�Q�在客户端尽��需要从服务器端下蝲已经更新好的�E�序�q�行�Q�而不必理会繁琐的下蝲、安装和配置的过�E��?o:p>
�q�里不得不提Java的是WebStart技术�?o:p>
WebStart是让用户只需在网��上点击一个超�U�链接就能运行一个Java桌面应用的技术。对于一个拥有WebStart能力的Java应用来说�Q�用户��用它��和使用WEB应用一��L��单，但它所��h��的界面能力和本地处理能力却是WEB应用无法望其��背的�?o:p>
具体的应用的技术知识可以从http://java.sun.com中寻扄��x��档，�q�里不一一赘述�?o:p>
Rich Client的通信机制
除了快捷方便的发布外�Q�Rich Client�q�需要与服务器端建立一�U�快速、可靠、强大、易用的通信交互机制。但我们开发WEB应用�Ӟ��表现层和业务服务层常常只是同一个进�E�中的不同对象，它们之间的交互不�q�是Java的方法调用而已�Q�当表现层逻辑被分发到世界各地的计��机上，客户端和服务器之间的交互��成了一个大问题——从前的C/S被淘汎ͼ�很大�E�度上归咎于socket通信的复杂性�?o:p>
现在�Q��Ş形色色的RPC�Q�远�E�过�E�调用，Remote Procedure Call�Q�技术以独特的优势扮演�v了信使的角色。以下列丑և��U�Rich Client可以采用的通信机制�?o:p>
CORBA�?/b>RMI
CORBA�Q�通用对象��h��代理体系�l�构�Q�Common Object Request Broker Architecture�Q�曾�l�红极一�Ӟ��它能够兼容各�U�操作系�l��^台的语言�Q�强大的的可扩展性所带来的负面媄响就是实现的复杂和繁琐。如果服务器端和客户端都采用Java开发，那么CORBA所需要的语言无关的IDL��完全变成了画蛇添��。当�Ӟ��对于需要集成大量企业内遗留的系�l�的EAI�Q�企业应用集成）��目中，它一直是首选的技术�?/p>

爱饭�?/a> 2006-04-18 12:36 发表评论

在DOS实模式下直接存取4GB内存

Wed, 14 Dec 2005 03:57:00 GMT
       作�ؓ软�g开发�h员，大多数对于保护模式都感到��秘和不易理解。本人在开�?2位微内核抢占式多�U�程操作�pȝ��q�程中，深入了解到CPU的地址机理�Q�在�q�里��分析CPU的工作原理，解开保护模式的神�U�面�U�，读者将会发��C��护模式其实与实模式一��L��单和易于控制。在此基��上用四五十行C语言�E�序做到�q�出保护模式和在实模式之下直接访问整�?GB内存�I�间�?BR>        虽然有许多书�c�对保护模式作解释，但没有一本能��单明了地解释清楚�Q�冗长烦杂的术语让�h看着��x��瞌睡�Q�甚臌��有许多用汇编写的(可能�Ҏ��不能�q�行�?保护模式试验�E�序�Q�事实上用C语言本��n��可以做保护模式的进出工作�?BR>       我们可能知道CPU上电后从ROM中的BIOS开始运行，而Intel文档却说80x86CUP上电��L��从最高内存下16字节开始执行，那么BIOS是处在内存的最��端64K(FFFF0000H)�q�是1M之下�?4K(F0000H)处呢?事实上在�q�两个地斚w��同时出现(可用后面存取4GB内存的程序验�?�?BR>��Z��?��Z��弄清楚以上问题，首先要了解CPU是如何处理物理地址�?真的是在实模式下用段寄存器左�U?位与偏移量相加，在保护模式下用段描述�W�中的基地址加偏�U�量而两者是毫无兌��的吗?�{�案是两者其实是一��L��。当Intel�?0286推出时其地址�I�间变成�?4位，�?086�?0位到24位，十分自然地要加大�D�寄存器才行�Q�实际上它们都被加大了，只是�׃��保护的原因加大的部分没有被程序看见，��C��80386之后地址又从24位加大到32�?80386SX�?4�?。整个段寄存器如下图所�C�：
@@12A08400.GIF;�?@@
�?086中CPU只有“看得见部分”，从而也直接参与了地址形成�q�算�Q�但�?0286之后�Q�在“看不见部分”中已经包含了地址��|��“看得见部分”就退化�ؓ只是一个标号再也不用参与地址形成�q�算了。地址的�Ş成��L��从“不可看见部分”取出基址��g��偏移相加形成地址。也��是说在实模式下当一个段寄存器被装入一个值时�Q�“看不见部分”的界限被设成FFFFH�Q�基址部分才是要装入值左�U?位，属性部分设�?6�?�Ҏ��U�。这个过�E�与保护模式时装入一个段存器是同理的�Q�只是保护模式的“不可见部分”是从描�q�表中取��|��而实模式是一套固定的�q�程�?BR>对于CPU在�Ş成地址�Ӟ��是没有实模式与保护模式之分的�Q�它只管用基址(“不可见部分�?��d��上偏�U�量。实模式与保护模式的差别实际上只是保护处理部件是否工作得更精��而已�Q�比如不允许代码�D늚�写入。实模式下的�D�寄存装入有固定的�Ş成办法从而也��׃��需要保护模式的“描�q�符”了�Q�因此保持了�?086/8088的兼�Ҏ��。而“描�q�符”也只是��Z��装入�D�寄存器的“不可见部分”而设的�?BR>从上面的“整个段寄存器”可见CPU的地址形成与“看得见部分”的当前值毫无关�p�，�q�也解释了�ؓ什么在刚进入保护模式时后面的代码依然被正确地运行而这时代码段寄存器CS的值却�q�是�q�入保护模式前的实模式��|��或者从保护模式回到实模式时代码�D�CS被改变之前程序是正常地工作，而不会“突变”到CS左移4位的地址上去�Q�比如在保护模式时CS�?8H的选择器，��C��实模式时CS�q�是08H但地址不会�H�然变成80H加上偏段量中厅R��因为地址的�Ş成不理会�D�寄存器“看得见部分”的当前��|��q�一个值只是在被装入时对CPU有用�?BR>地址的�Ş成与CPU的工作模式无养I��也就是说实模式与0�Ҏ��U�保护模式不分页时是一模一��L��。明白了�q�一机理�Q�在实模式下一样可以处理通常被认为只有在保护模式才能做的事，比如讉K��整个机器的内存。可以不必理会保护模式下的众多术语，或者更易于理解�Q�如选择器就是“看得见部分”，描述�W�是��Z��装入“不可见部分”而设的�?BR>作�ؓ验证CPU的这�U�机理，�q�里写了一个实模式下访�?GB内存的C�E�序。有一些书�c�也介绍有同样功能的汇编�E�序�Q�但它们都错误地认�ؓ是利�?0386芯片的设计疏漏。实际上Intel本��n��在使用�q�种办法�Q��得CPU上电时能从FFFFFFF0H处开始第一条指令，�q�种技术在286之后的每一台机器每一�ơ冷启动旉��使用�Q�只是我们不知道�|�了。CPU上电也整个代码段寄存器是�q�样的：
@@12A08401.GIF;�?@@
EIP=0000FFF0H
�q�样CS∶EIP形成了FFFFFFF0H的物理地址�Q�当CPU�q�行一�ơ远跌��{重新装入CS�Ӟ��基址��变了�?BR>��Z��讉K��4G内存�I�间�Q�必��L��一个段寄存器的“不可见部分”的界限�?G-1�Q�基址�?�Q�这样就包含�?GB内存�Q�不必理会可见部分的倹{��显然要让段寄存器在实模式下直接装入�q�些值是不可能的。唯一的办法是让CPU�q�入一会儿保护模式在装入了�D�寄存器之后马上回到实模式�?BR>�q�入保护模式十分��单，只要建好GDT把CRO寄存器的�?�|�上1�Q�CPU��在保护模式了，从前面所分析CPU地址形成机理可知�Q�这时不必理会寄存器的“看得见部分”值是否合法，各种�D�寄存器是一样可用的�Q�就像没�q�保护模式一栗��在把一个包含有4GB地址�I�间的��D��入某个段寄存器之后就可返回实模式�?BR>预先可徏好GDT如下�Q?BR>unsigned long GDT-Table[]={0,0, //�I�描�q�符�Q�必��Mؓ�?x0000FFFF,0xCF9A00, //32位��^面式代码�D?x0000FFFF,0xCF9200 } , //32位��^面式数据�D�只是�ؓ了访问数据的话只�?个GDT��p��够了�Q�因为�ƈ没有重装代码�D�，�q�里�l�出3个GDT只是��Z��完整性�?BR>通常在进入保护模式时要关闭所有的中断�Q�把IDTR的界限设�|��ؓ0�Q�CPU自动关闭所有中断，包括NMI�Q�返回实模式后恢复IDTR�q�开中断�?BR>另外A20地址�U�的控制对于正确讉K��整个内存也很重要�Q�在�q�入保护模式前要�?042打开A20地址�Uѝ�?BR>在这个例子里FS�D�寄存器设成可访�?GB内存的基址和界限，�׃��在DOS中很��有�E�序会用到GS、FS�q�两�?86增加的段寄存器，当要��d��4GB范围中的��M��个地斚w��可通过FS�D�|��辑ֈ��Q�直到FS在实模式下被重装入冲掉�ؓ止�?BR>�q�个例子�?86SX�?86DX�?86上都�q�行通过。例子里加有十分详细的注释，�׃��q�一�E�序是用BC 3.1�~�译�q�接的，而其�q�接器不能�ؓDOS�E�序处理32位寄存器�Q�所以直接在代码中加入操作码前缀0x66和地址前缀0x67�Q�以便让DOS实模式下�?6位程序可�?2位寄存器和地址。程序的双��以注释�Ş式给出等效的32位指令。要注意16位的指��o中mov al, byte ptr [BX]的指令码正好�?2位的指��omov al, byte ptr[EDI]�?BR>读者可用这个程序验证BIOS是否同时在两个区域出现。如果有�U�性定址能力的VESA昄��?如TVGA9440)�q�可�q�一步验证线性显�C�缓冲区�?MB之上的工作情��c�?BR>#include
unsigned long GDT-Table[]=
{0,0, //NULL - 00H
0x0000FFFF,0x00CF9A00, //Code32 - 08h Base=0 Limit=4G-1 Size=4G
0x0000FFFF,0x00CF9200 //Data32 - 10h Base=0 Limit=4G-1 Size=4G
};
unsigned char OldIDT [6]={0}; //Save The IDTR before Enter Protect Mode.
unsigned char pdescr-tmp [6]={0}; //NULL The IDTR s Limit=0 CPU will
// disable all Interrupts, include NMI.
#define KeyWait() {while(inportb(0x64) &2);}
void A20Enable(void)
{
keyWait ();
outportb(0x64,0xD1);
KeyWait();
outportb(0x60,0xDF); //Enable A20 with 8042.
KeyWait();
outportb(0x64,0xFF);
KeyWait ();
}
void LoadFSLimit4G(void)
{
A20Enable (); //Enable A20
//***
Disable ints & Null IDT
//***
asm {
CLI //Disable inerrupts
SIDT OldIDT //Save OLD IDTR
LIDT pdescr-tmp //Set up empty IDT.Disable any interrupts,
} // Include NMI.
//***
Lodd GDTR
//***
asm{ // The right Code is Real, But BC++ s Linker NOT
// Work with 32bits Code.
db 0x66 //32 bit Operation Prefix in 16 Bit DOS.
MOV CX,DS //MOV ECX,DS
db 0x66 //Get Data segment physical Address
SHL CX,4 //SHL ECX,4
MOV word ptr pdescr-tmp [0],(3*8-1)
//MOV word ptr pdescr-tmp [0], (3*8-1)
db 0x66
XOR AX,AX //XOR EAX,EAX
MOV AX,offset GDT-Table
// MOV AX,offset GDT-Table
db 0x66
ADD AX,CX //ADD EAX,ECX
MOV word ptr pdescr-tmp [2], AX
//GDTR Base low16 bits
db 0x66
SHR AX,16 //SHR EAX,16
MOV word ptr pdescr-tmp [4],AX
//GDTR Base high16 bits
LGDT pdescr-tmp //Load GDTR
}
//****
//* Enter 32 bit Flat Protected Mode
//****
asm{
mov DX,0x10 // The Data32 Selector
db 0x66,0x0F,0x20,0xC0 // MOV EAX,CR0
db 0x66
MOV BX,AX // MOV EBX,EAX
OR AX,1
db 0x66,0x0F,0x22,0xC0
//MOV CRO,EAX // Set Protection enable bit
JMP Flsuh
} //Clear machine perform cache.
flush: // Now In Flat Mode, But The CS is Real Mode Value.
asm { //And it s attrib is 16Bit Code Segment.
db 0x66
MOV AX,BX //MOV EAX,EBX
db 0x8E,0xE2 //MOV FS,DX
//Load FS Base=0 Size=4G now
db 0x66,0x0F,0x22,0xC0 //MOV CRO,EAX
//Return Real Mode.
LIDT OldIDT //LIDT OldIDT //Restore IDTR
STI // STI //Enable INTR
}
}
unsigned char ReadByte (unsigned long Address)
{
asm db 0x66
asm mov di,word ptr Address // MOV EDI, Address
asm db 0x67 //32 bit Address Prefix
asm db 0x64 //FS:
asm mov al,byte ptr [BX] // =MOV AL, FS: [EDI]
return -AL;
}
unsigned char WriteByte(unsigned Long Address)
{
asm db 0x66
asm mov di,word ptr Address //MOV EDI, Address
asm db 0x67 //32 bit Address Prefix
asm db 0x64 //FS:
asm mov byte ptr [BX],al //=MOV FS: [EDI],AL
return -AL;
}
//////// Don t Touch Above Code ///
# include
void Dump4G (unsigned long Address)
{
int i;
int j;
for (i=0; i<20; i++)
{
printf (�?081X: �? (Address+i*16));
for (j=0; j<16;j++)
printf ("% 02X" ,ReadByte (Address+i*16+j));
printf (" ");
for (j=0;j<16;j++)
{
if (ReadByte (Address+i*16+j) <0x20) printf (" . ");
else printf (" %C ", ReadByte (Address+i*16+j));
}
printf (" ");
}
}
main ()
{
unsigned long Address=0;
unsigned long tmp;
LoadFSLimit4G ();
printf ("====Designed By Southern. 1995.7.17==== ");
printf (" Now you can Access The Machine All 4G Memory. ");
printf (" Input the Start Memory Physical to DUMP. ");
printf (" Press D to Cuntinue DUMP, 0 to End & Quit, ");
do {
printf ("-");
scanf ("%IX", &tmp);
if (tmp==0x0d) Address+=(20*16);
else Address=tmp;
Dump4G (Address);
}while (Address !=0);
return 0;
}

(作者地址�Q�珠��巨人集团电脑排版公�?

爱饭�?/a> 2005-12-14 11:57 发表评论

Win2k内存分页机制 (一)- -

Wed, 14 Dec 2005 03:30:00 GMT


基本概念

    Windows 2000 使用��Z��分页机制的虚拟内存。每个进�E�有4GB的虚拟地址�I�间。基于分��|��Ӟ��q?GB地址�I�间的一些部分被映射了物理内存，一些部分映��硬盘上的交换文�Ӟ��一些部分什么也没有映射。程序中使用的都�?GB地址�I�间中的虚拟地址。而访问物理内存，需要��用物理地址�?BR>
下面我们看看什么是物理地址�Q�什么是虚拟地址�?BR>
物理地址 (physical address): 攑֜��d��ȝ��上的地址。放在寻址�ȝ��上，如果是读�Q�电路根据这个地址每位的值就��相应地址的物理内存中的数据放到数据�ȝ��中传输。如果是写，电�\�Ҏ��q�个地址每位的值就��相应地址的物理内存中攑օ�数据�ȝ��上的内容。物理内存是以字�?8�?为单位编址的�?BR>
虚拟地址 (virtual address): 4G虚拟地址�I�间中的地址�Q�程序中使用的都是虚拟地址�?BR>
如果CPU寄存器中的分��|��志位被设�|�，那么执行内存操作的机器指令时�Q�CPU会自动根据页目录和页表中的信息，把虚拟地址转换成物理地址�Q�完成该指��o。比�?mov eax,004227b8h �Q�这是把地址004227b8h处的��D��l�寄存器的汇�~�代码，004227b8�q�个地址��是虚拟址。CPU在执行这行代码时�Q�发现寄存器中的分页标志位已�l�被讑֮��Q�就自动完成虚拟地址到物理地址的�{换，使用物理地址取出��|��完成指��o。对于Intel CPU 来说�Q�分��|��志位是寄存器CR0的第31位，�?表示使用分页�Q��ؓ0表示不��用分��c��对于初始化之后�?Win2k 我们观察 CR0 �Q�发现第31位�ؓ1。表明Win2k是��用分��늚��?BR>
    使用了分��|��制之后，4G的地址�I�间被分成了固定大小的页�Q�每一��|��者被映射到物理内存，或者被映射到硬盘上的交换文件中�Q�或者没有映��Q何东�ѝ��对于一般程序来��_��4G的地址�I�间�Q�只有一��部分映��了物理内存�Q�大片大片的部分是没有映��Q何东�ѝ��物理内存也被分��，来映��地址�I�间。对�?2bit的Win2k�Q�页的大��是4K字节。CPU用来把虚拟地址转换成物理地址的信息存攑֜�叫做��늛�录和��表的结构里�?BR>
    物理内存分页�Q�一个物理页的大��ؓ4K字节�Q�第0个物理页从物理地址 0x00000000 处开始。由于页的大��ؓ4KB�Q�就�?x1000字节�Q�所以第1��从物理地址 0x00001000 处开始。第2��从物理地址 0x00002000 处开始。可以看到由于页的大��是4KB�Q�所以只需�?2bit的地址中高20bit来寻址物理��c�?/FONT>

    ��表�Q�一个页表的大小�?K字节�Q�放在一个物理页中。由1024�?字节的页表项�l�成。页表项的大��ؓ4个字�?32bit)�Q�所以一个页表中�?024个页表项。页表中的每一��的内容�Q�每��?个字�?32bit�Q�高20bit用来放一个物理页的物理地址�Q�低12bit攄��一些标志�?BR>
    ��늛�录，一个页目录大小�?K字节�Q�放在一个物理页中。由1024�?字节的页目录��组成。页目录��的大小�?个字�?32bit)�Q�所以一个页目录中有1024个页目录��V��页目录中的每一��的内容�Q�每��?个字节）�?0bit用来放一个页表（��表攑֜�一个物理页中）的物理地址�Q�低12bit攄��一些标志�?/FONT>

    对于x86�pȝ��Q�页目录的物理地址攑֜�CPU的CR3寄存器中�?BR>
    CPU把虚拟地址转换成物理地址�Q?BR>    一个虚拟地址�Q�大��?个字�?32bit)�Q�包含着扑ֈ�物理地址的信息，分�ؓ3个部分：�W?2位到�W?1位这10位（最�?0位）是页目录中的索引�Q�第12位到�W?1位这10位是��表中的索引�Q�第0位到�W?1位这12位（�?2位）是页内偏�U�R��对于一个要转换成物理地址的虚拟地址�Q�CPU首先�Ҏ��CR3中的��|��扑ֈ��늛�录所在的物理��c��然后根据虚拟地址的第22位到�W?1位这10位（最高的10bit)的��g��为烦引，扑ֈ�相应的页目录��?PDE,page directory entry),��늛�录项中有�q�个虚拟地址所对应��表的物理地址。有了页表的物理地址�Q�根据虚拟地址的第12位到�W?1位这10位的��g��为烦引，扑ֈ�该页表中相应的页表项(PTE,page table entry),��表��中��有�q�个虚拟地址所对应物理��늚�物理地址。最后用虚拟地址的最�?2位，也就是页内偏�U�，加上�q�个物理��늚�物理地址�Q�就得到了该虚拟地址所对应的物理地址�?/FONT>

    一个页目录�?024��，虚拟地址最高的10bit刚好可以索引1024��（2�?0�ơ方�{�于1024�Q�。一个页表也�?024��，虚拟地址中间部分�?0bit�Q�刚好烦�?024��V��虚拟地址最低的12bit�Q?�?2�ơ方�{�于4096�Q�，作�ؓ��内偏移�Q�刚好可以烦�?KB�Q�也��是一个物理页中的每个字节�?/FONT>

    一个虚拟地址转换成物理地址的计��过�E�就是，处理器通过CR3扑ֈ�当前��늛�录所在物理页�Q�取虚拟地址的高10bit,然后把这10bit右移2bit�Q�因为每个页目录��?个字节长�Q�右�U?bit相当于乘4�Q�得到在该页中的地址�Q�取��地址处PDE�Q?个字节）�Q�就扑ֈ�了该虚拟地址对应��表所在物理页�Q�取虚拟地址�W?2位到�W?1位这10位，然后把这10bit右移2bit�Q�因为每个页表项4个字节长�Q�右�U?bit相当于乘4�Q�得到在该页中的地址�Q�取��地址处的PTE�Q?个字节）�Q�就扑ֈ�了该虚拟地址对应物理��늚�地址�Q�最后加�?2bit的页内偏�U�d��C��物理地址�?BR>
    32bit的一个指针，可以��d��范围0x00000000-0xFFFFFFFF,4GB大小。也��是说一�?2bit的指针可以寻址整个4GB地址�I�间的每一个字节。一个页表项负责4K的地址�I�间和物理内存的映射�Q�一个页�?024��，也就是负�?024*4k=4M的地址�I�间的映��。一个页目录��，对应一个页表。一个页目录�?024��，也就对应着1024个页表，每个��表负责4M地址�I�间的映��?024个页表负�?024*4M=4G的地址�I�间映射。一个进�E�有一个页目录。所以以��ؓ单位�Q�页目录和页表可以保�?G的地址�I�间中的每页和物理内存的映射�?BR>
    每个�q�程都有自己�?G地址�I�间�Q�从 0x00000000-0xFFFFFFFF 。通过每个�q�程自己的一套页目录和页表来实现。由于每个进�E�有自己的页目录和页表，所以每个进�E�的地址�I�间映射的物理内存是不一��L��。两个进�E�的同一个虚拟地址处（如果都有物理内存映射�Q�的��g��般是不同的，因�ؓ他们往往对应不同的物理页�?BR>
    4G地址�I�间中低2G�Q?x00000000-0x7FFFFFFF 是用户地址�I�间�Q?G地址�I�间中高2G�Q?BR>0x80000000-0xFFFFFFFF 是系�l�地址�I�间。访问系�l�地址�I�间需要程序有ring0的权限�?/FONT>

作�? JIURL

爱饭�?/a> 2005-12-14 11:30 发表评论

const用法

Fri, 09 Dec 2005 02:54:00 GMT
const主要是�ؓ了程序的健壮�?SPAN lang=EN-US>,减少�E�序出错.
最基本的用�?SPAN lang=EN-US>:
const int a=100; b的内容不�?SPAN lang=EN-US>,b只能�?SPAN lang=EN-US>100也就是声明一�?SPAN lang=EN-US>int�c�d��的常�?SPAN lang=EN-US>(#define b =100)
int const b=100; //和上面作用一�?SPAN lang=EN-US>

const指针和引用一般用在函数的参数�?SPAN lang=EN-US>
int* m = &a; //出错,帔R��只能用常指针
int c= 1;const int*pc = &c;//常指针可指向帔R��

const int* pa = &a; //指针指向的内容�ؓ帔R��(��是b的��g��?SPAN lang=EN-US>)
int const *a = &b; //指针指向的内容�ؓ帔R��(��是b的��g��?SPAN lang=EN-US>)*p=3//error
int* const a = &b; //指针为常�?SPAN lang=EN-US>,不能更改指针了如 a++但可以改�?SPAN lang=EN-US>*p=3;

从这可以看出const攑֜�*左侧修饰的是指针的内�?SPAN lang=EN-US>,const攑֜�*右侧修饰的是指针
本��n.

const引用的用法和指针一�?SPAN lang=EN-US>
int const & a=b; 和指针一�?SPAN lang=EN-US>
const int& a=b; 和指针一�?SPAN lang=EN-US>
但没�?SPAN lang=EN-US> int& const a=b 的用法因为引用不能做�U�M��q�算�Q�但只是��Z��warning

const int* const a = &b; //�l�合应用,一般用来传递多�l�的数组
�c�d��Q?SPAN lang=EN-US>char* init[] = {"Paris","in the","Spring"};
void fun(const int* const a){}
fun(init)//保护参数不被修改

int A(int)const; //是常函数�Q�只能用在类中，调用它的对象不能�Ҏ��变成员�?SPAN lang=EN-US>
const int A(); //�q�回的是帔R��,所以必��这么调�?SPAN lang=EN-US> cosnt int a=A();
int A(const int); //参数不能改�?SPAN lang=EN-US>,可用在�Q意函�?SPAN lang=EN-US>
int A(const int*);
....
int height() const;//常函数只能由常函数调�?SPAN lang=EN-US>
int max(int,int) const;
int Max = max(height(),height());

const int* pHeap = new int;
delete pHeap;
p = NULL;//出错
我的解决办法是强制类型�{�?SPAN lang=EN-US>
const int* pHeap = new int(1);
delete (int*)pHeap;
pHeap = NULL;

一�?SPAN lang=EN-US>const 和引用联合��用的时候要注意

const int a = 1;
const int& ref1 = a;
const int& ref2 = 1;

ref1 �?SPAN lang=EN-US> ref2 都是正确的，但是他们引用的内容和一般的引用不同
�?SPAN lang=EN-US> const int& ref1 = a; 而言�Q�其实这�?SPAN lang=EN-US> ref1 已经�?SPAN lang=EN-US> a 没有��M��关系�?SPAN lang=EN-US>
ref1 实际上是对一个��旉��的引用。同�?SPAN lang=EN-US> const int& ref2 = 1; 也是�?SPAN lang=EN-US>
一个��旉��做的引用。当引用临时量是 C++ 的隐式类型�{换可以�v作用�?SPAN lang=EN-US>
临时量的生存期和引用量的生存期相同�?SPAN lang=EN-US>

二、强�?SPAN lang=EN-US>const对象可能��D��无定义行�?SPAN lang=EN-US>

对于优化做的比较好的�~�译器，代码 const int i = 1;
当后面用到变�?SPAN lang=EN-US> i 的时候，�~�译器会优化掉对 i 的存取，而直接��用立��x�� 1

const int i = 1;

*(const_cast(&i)) = 2;
cout << *(int*)&i << endl;
cout << i << endl;

所以，�?SPAN lang=EN-US> const 对象�?SPAN lang=EN-US> const_cast 可能��D��无定义行�?SPAN lang=EN-US>
目前我就遇到�q�些问题�Q�那位还有补充的�?SPAN lang=EN-US>

能不能把自己的经验也谈谈。大家交��交��?SPAN lang=EN-US>
�q�个��是我在调错时发现的
int height() const;//常函数只能由常函数调�?SPAN lang=EN-US>
int max(int,int) const;
int Max = max(height(),height());

Thinking again in C++�Q�一�Q�常量性原�?SPAN lang=EN-US> cphj�Q�原作）
有些地方很受启发

1.不能��?SPAN lang=EN-US>const修饰的�Q何对象、引用和指针作�ؓ赋��D��辑ּ�的左倹{�?SPAN lang=EN-US>
const int cx=100;
const int & rcx=cx;
const int * pcx=&cx;
cx=200; //error
rcx=200; //error
*pcx=200; //error

2.const�c�d��的对象不能直接被non-const�c�d��的别名所引用�?SPAN lang=EN-US>
(1)不能��?SPAN lang=EN-US>const�c�d��的对象传递给non-const�c�d��的引用�?SPAN lang=EN-US>
const int cx=100;
int & rx=cx; //error
(2)不能��?SPAN lang=EN-US>const�c�d��的实参传递给形参�?SPAN lang=EN-US>non-const�c�d��引用的函数�?SPAN lang=EN-US>
void f(int a)
{
}
void g(int & ra)
{
}
const int cx=100;
f(cx); //ok
g(cx); //error
(3)不能��?SPAN lang=EN-US>const�c�d��的对象作�?SPAN lang=EN-US>non-const�c�d��引用的函数返回倹{�?SPAN lang=EN-US>
int & f(const int & rca)
{
return rca; //error
}
int x=100;
f(x);

3.可以使用const�c�d��别名引用non-const对象。此旉��过const引用不能修改对象�Q�但对象可以通过non-const引用被修攏V�?SPAN lang=EN-US>
int x=100;
int & rx=x;
const int & rcx=x; //ok
x=200;
rx=200;
rcx=200; //error

4.指针的属性有两个�Q�指针的�c�d��和指针本�w�的帔R��性。其中，指向const对象与指�?SPAN lang=EN-US>non-const对象�Q�是不同的指针类型�?SPAN lang=EN-US>
int x=100;
const int * pcx=&x; //[1]
int * px=&x; //[2]
int y=100;
int * const cpy=&y; //[3]
int * py=&y; //[4]
[1][2]两个指针的类型不同；[3][4]两个指针的常量性不同�?SPAN lang=EN-US>
对象与指向对象的指针的规则类��g��对象与引用。即�Q?SPAN lang=EN-US>const�c�d��的对象不能直接被non-const�c�d��的指针所指示�Q�同2�Q�；可以使用const�c�d��的指针指�?SPAN lang=EN-US>non-const对象�Q�同3�Q��?SPAN lang=EN-US>

5.可以��相同类型（包括帔R��性）�?SPAN lang=EN-US>const指针��D��l?SPAN lang=EN-US>non-const指针�?SPAN lang=EN-US>
int x=100;
int * px;
const int * pcx=&x;
px=pcx; //error
int * const cpx=&x;
px=cpx; //ok

6.若函数的�q�回��gؓ内徏�c�d��或是指针�Q�则该返回��D��动成�?SPAN lang=EN-US>const性质。但自定义类型则�?SPAN lang=EN-US>non-const性质�?SPAN lang=EN-US>
int f() //相当于返�?SPAN lang=EN-US>const int
{
return 100;
}
int * g(int & ra) //相当于返�?SPAN lang=EN-US>int * const
{
return &ra;
}
class CTest
{
int n;
public:
CTest(int n){this->n=n;}
};
CTest h() //�q�回的就�?SPAN lang=EN-US>CTest
{
return CTest(200);
}

f()=200; //error

int x=100;
int y=200;
int * px=&x;
g(y)=px; //error
*g(y)=x; //ok�Q�从�q�点可以看出g()�q�回的不�?SPAN lang=EN-US>const int *

CTest t(100);
h()=t; //ok�Q�但却是完全错误的、危险的做法
//所�?SPAN lang=EN-US>h()的正��写法是�q�回const CTest

const int b=100; b的内容不�?SPAN lang=EN-US>,b只能�?SPAN lang=EN-US>100
int const b=100; b必须�?SPAN lang=EN-US>int�?SPAN lang=EN-US>,不能为其他类�?SPAN lang=EN-US>?
�q?SPAN lang=EN-US>2句话的意思应该是一��L��?�Q?SPAN lang=EN-US> THINKING IN C++是这栯��?SPAN lang=EN-US>

const int a=100; a的内容不�?SPAN lang=EN-US>,a只能�?SPAN lang=EN-US>100�Q�同样不能类型�{换）�?SPAN lang=EN-US>
int const b=100; b必须�?SPAN lang=EN-US>int�?SPAN lang=EN-US>,不能为其他类�?SPAN lang=EN-US>?�Q�同样在使用中不能修改）�?SPAN lang=EN-US>
所�?SPAN lang=EN-US>a�?SPAN lang=EN-US>b是一��L��Q�称为整型常敎ͼ�在��用中不能被修改，当然都不能�{为其他类型了�?SPAN lang=EN-US>
#include

using namespace std;

int main()
{
　　const int a = 100;
　　int const b = 100;

　 a = 100; //�q�四条语句编译时都会出现�?SPAN lang=EN-US>Cannot modify a const object
b = 100; //in function main()”的错误提示�Q�也��是��_��M��企图修改　　 a = 100.0;　//a�?SPAN lang=EN-US>b�Q�其实是一��L��Q�的行�ؓ都会出现“灾�䏀�，在语法上讲就　　b = 100.0; //�?SPAN lang=EN-US>a�?SPAN lang=EN-US>b都不能出现在赋��D��句的左边�Q?SPAN lang=EN-US>

　　cout<<'\n'<
　　return 0;
}

常函数的调用是这��L��Q�常量对象只能调用常成员函数�Q�非帔R��对象卛_��以调常成员函敎ͼ�也可以调一般成员函敎ͼ�但当某个函数�?SPAN lang=EN-US>const和非const两个版本�Ӟ��const对象�?SPAN lang=EN-US>const版本�Q�非const对象调非const版本
例：
class A
{
public:
int & GetData(){return data;}
const int & GetData()const {return data;}
private:
int data;
}
A a;
a.GetData();//调用int & GetData(){return data;}
//但如果没有这个函敎ͼ�也可以调�?SPAN lang=EN-US>const int & GetData()const
const A const_a;
const_a.GetData();//调用const int & GetData()const {return data;}
常函数只能调常函敎ͼ�也是�׃��q�个原因

��你狠！加两�?SPAN lang=EN-US>

一�?SPAN lang=EN-US>const 和引用联合��用的时候要注意

const int a = 1;
const int& ref1 = a;
const int& ref2 = 1;

ref1 �?SPAN lang=EN-US> ref2 都是正确的，但是他们引用的内容和一般的引用不同
�?SPAN lang=EN-US> const int& ref1 = a; 而言�Q�其实这�?SPAN lang=EN-US> ref1 已经�?SPAN lang=EN-US> a 没有��M��关系�?SPAN lang=EN-US>
ref1 实际上是对一个��旉��的引用。同�?SPAN lang=EN-US> const int& ref2 = 1; 也是�?SPAN lang=EN-US>
一个��旉��做的引用。当引用临时量是 C++ 的隐式类型�{换可以�v作用�?SPAN lang=EN-US>
临时量的生存期和引用量的生存期相同�?SPAN lang=EN-US>

二、强�?SPAN lang=EN-US>const对象可能��D��无定义行�?SPAN lang=EN-US>

对于优化做的比较好的�~�译器，代码 const int i = 1;
当后面用到变�?SPAN lang=EN-US> i 的时候，�~�译器会优化掉对 i 的存取，而直接��用立��x�� 1

const int i = 1;

*(const_cast(&i)) = 2;
cout << *(int*)&i << endl;
cout << i << endl;

所以，�?SPAN lang=EN-US> const 对象�?SPAN lang=EN-US> const_cast 可能��D��无定义行�?SPAN lang=EN-US>

#include
void fun(char b){cout <<"void"<int fun(int const b){cout <<"int"<int main()
{
fun(1.0);//详细看看重蝲函数�?SPAN lang=EN-US>
fun(4); //想一惌��用哪一�?SPAN lang=EN-US>

return 0;
}
我试了一下，会出�?SPAN lang=EN-US>? vc��_��'fun':ambiguous call to overloaded function

补充的好啊，�q�个一般不会注意的
const int i = 1;
*(const_cast(&i)) = 2;
cout << *(int*)&i << endl;
cout << i << endl;
�q�个可真有意思，调试时两个都�?SPAN lang=EN-US>2�Q�可�~�译��是2�Q?SPAN lang=EN-US>1�?SPAN lang=EN-US>
const的永�q�都�?SPAN lang=EN-US>const,�q�样能更改就不错了，不然��p��相矛盾了
奇怪的�?SPAN lang=EN-US> pi �?SPAN lang=EN-US> &i地址一样啊�Q�就像楼上说的这是编译时的优�?SPAN lang=EN-US>
处理
const int i = 1;
int* pi=const_cast(&i);
*pi=2;
cout << *pi << endl;
cout << i << endl;

那个主要是隐式�{�?SPAN lang=EN-US>
你可依次把两个函数注掉看看调�?SPAN lang=EN-US>
#include
//void fun(char b){cout <<"void"<void fun(int b){cout <<"int"<int main()
{
fun('a');
fun(4);
return 0;
}

爱饭�?/a> 2005-12-09 10:54 发表评论

操作内存

Fri, 11 Nov 2005 05:11:00 GMT

操作内存

在前面的章节中，我们已经了解了寄存器的基本��用方法。而正如结��提到的那样�Q�仅仅��用寄存器做一点运��是没有什么太大意义的�Q�毕竟它们不能保存太多的数据�Q�因此，对编�E��h员而言�Q�他肯定�q�切地希望访问内存，以保存更多的数据�?/P>
我将分别介绍如何在保护模式和实模式操作内存，然而在此之前，我们先熟悉一下这两种模式中内存的�l�构�?/P>
3.1 实模�?/H3>
事实上，在实模式中，内存比保护模式中的结构更令�h困惑。内存被分割成段�Q��ƈ且，操作内存�Ӟ��需要指定段和偏�U�量。不�q�，理解�q�些概念是非常容易的事情。请看下面的图：

�D?寄存器这�U�格局是早期硬件电路限制留下的一个伤疤。地址�ȝ��在当时有20-bit�?/P>
然�?0-bit的地址不能攑ֈ�16-bit的寄存器里，�q�意味着�?-bit必须攑ֈ�别的地方。因此，��Z��讉K��所有的内存�Q�必��M��用两�?6-bit寄存器�?/P>
�q�一设计上的折衷�Ҏ��D��了今天的�D?偏移量格局。最初的设计中，其中一个寄存器只有4-bit有效�Q�然而�ؓ了简化程序，两个寄存器都�?6-bit有效�Q��ƈ在执行时求出加权和来标识20-bit地址�?/P>
偏移量是16-bit的，因此�Q�一个段�?4KB。下面的囑֏�以帮助你理解20-bit地址是如何�Ş成的�Q?/P>

�D?偏移量标识的地址通常记做 �D?偏移�?的�Ş式�?/P>
�׃��q�样的结构，一个内存有多个对应的地址。例如，0000:0010�?001:0000指的是同一内存地址。又如，

0000:1234 = 0123:0004 = 0120:0034 = 0100:0234
0001:1234 = 0124:0004 = 0120:0044 = 0100:0244

作�ؓ负面影响之一�Q�在�D�上�?相当于在偏移量上�?6�Q�而不是一个“全新”的�D�c��反之，在偏�U�量上加16也和在段上加1�{��h。某些时候，据此认�ؓ�D늚�“粒度”是16字节�?/P>
�l�习�?BR>��试一下将下面的地址转化�?0bit的地址�Q?/P>

2EA8:D678 26CF:8D5F 453A:CFAD 2933:31A6 5924:DCCF
694E:175A 2B3C:D218 728F:6578 68E1:A7DC 57EC:AEEA

�E�高一些的要求是，写一个程序将�D��ؓAX、偏�U�量为BX的地址转换�?0bit的地址�Q��ƈ保存于EAX中�?/P>
[上面习题的答�?/SPAN>]

我们现在可以写一个真正的�E�序了�?/P>
�l�典�E�序�Q�Hello, world

;;; 应该得到一�?9字节�?com文�g

.MODEL TINY
.CODE

CR equ 13
LF equ 10
TERMINATOR equ '$'

ORG 100h

Main PROC
mov dx,offset sMessage
mov ah,9
int 21h
mov ax,4c00h
int 21h
Main ENDP

sMessage:
DB 'Hello, World!'
DB CR,LF,TERMINATOR

END Main

; .COM文�g的内存模型是‘TINY�?BR>; 代码�D�开�?BR>
; 回�R
; 换行
; DOS字符串结束符

; 代码起始地址为CS:0100h

; 令DS:DX指向Message
; int 21h(DOS中断)功能9 -
; 昄��字符串到标准输出讑֤�
; int 21h功能4ch -
; �l�止�E�序�q�返回AL的错误代�?BR>　
　

; �E�序�l�束的同时指定入口点为Main

那么�Q�我们需要解释很多东�ѝ�?/P>
首先�Q�作为汇�~�语�a�的抽象，C语言拥有“指针”这个数据类型。在汇编语言中，几乎所有对内存的操作都是由对给定地址的内存进行访问来完成的。这��P��在汇�~�语�a�中，�l�大多数操作都要和指针��生或多或��的联系�?/P>
�q�里我想��的是�Q�由于这一�Ҏ��，汇编语言中同样会出现C�E�序中常见的�~�冲区溢出问题。如果你正在设计一个与安全有关的系�l�，那么最好是仔细��查你用到的每一个串�Q�例如，它们是否一定能够以你预期的方式�l�束�Q�以及（如果使用的话�Q�你的缓冲区是否能保证实际可能输入的数据不被写入到它以外的地斏V��作��Z��个汇�~�语�a��E�序员，你有义务��查每一行代码的可用性�?/P>
�E�序中的equ伪指令是宏汇�~�特有的�Q�它的意思接�q�于C或Pascal中的const�Q�常量）。多数情况下�Q�equ伪指令�ƈ不�ؓ�W�号分配�I�间�?/P>
此外�Q�汇�~�程序执行一��Ҏ��作是非常�J�琐的，通常�Q�在对与效率要求不高的地方，我们习惯使用�pȝ��提供的中断服务来完成��d��。例如本例中的中�?1h�Q�它是DOS时代的中断服务，在Windows中，它也被认为是Windows API的一部分�Q�这一点可以在Microsoft的文档中查到�Q�。中断可以被理解为高�U�语�a�中的子程序，但又不完全一样——中断��用系�l�栈来保存当前的机器状态，可以��q��件发��P��通过修改机器状态字来反馈信息，�{�等�?/P>
那么�Q�最后一�D�通过DB存放的数据到底保存在哪里了呢�Q�答案是紧挨着代码存放。在汇编语言中，DB和普通的指��o的地位是相同的。如果你的汇�~�程序�ƈ不知道新的助记符�Q�例如，新的处理器上的CPUID指��o�Q�，而你很清楚，那么可以用DB 机器码的方式��写下指��o。这意味着�Q�你可以��越汇编器的能力撰写汇编�E�序�Q�然而，直接用机器码�~�程是几乎肯定是一件费力不讨好的事——汇�~�器厂商会经常更新它所支持的指令集以适应市场需要，而且�Q�你可以期待你的汇编其能够��生正��的代码�Q�因为机器查表是不会出错的。既然机器能够帮我们做将�E�序转换��Z��码这件事情，那么��Z��么不让它来做呢？

�l�心的读者不隑֏�玎ͼ�在程序中我们没有对DS�q�行赋倹{��那么，�q�是否意味着�E�序的结果将是不可预��的呢？�{�案是否定的。DOS�Q�或Windows中的MS-DOS VM�Q�在加蝲.com文�g的时候，会对寄存器进行很多初始化�?com文�g被限制�ؓ��于64KB�Q�这��P��它的代码�D�c��数据段都被装入同样的数��|��卻I��初始状态下DS=CS�Q��?/P>
也许会有��Q�“嘿�Q�这听�v来不太好�Q�一�?4KB的程序能做得了什么呢�Q�还有，你吹得天�׃ؕ坠的堆栈�D�在什么地方？”那么，我们来看看下面这个新的Hello world�E�序�Q�它是一个EXE文�g�Q�在DOS实模式下�q�行�?/P>

;;; 应该得到一�?61 字节的EXE文�g

.MODEL SMALL
.STACK 200h

CR equ 13
LF equ 10
TERMINATOR equ '$'

.DATA

Message DB 'Hello, World !'
DB CR,LF,TERMINATOR

.CODE

Main PROC
mov ax, DGROUP
mov ds, ax

mov dx, offset Message
mov ah, 9
int 21h

mov ax, 4c00h
int 21h
Main ENDP

END main 　
; 采用“SMALL”内存模�?BR>; 堆栈�D?/FONT>

; 回�R
; 换行
; DOS字符串结束符

; 定义数据�D?/FONT>

; 定义昄��?/FONT>

; 定义代码�D?/FONT>

; ��数据段
; 加蝲到DS寄存�?/FONT>

; 讄��DX
; 昄��

; �l�止�E�序

561字节�Q�实现相同功能的�E�序大了�q�么多！��Z��么呢�Q�我们看刎ͼ��E�序拥有了完整的堆栈�D�c��数据段、代码段�Q�其中堆栈段��占掉�?12字节�Q�其余的基本上没什么变化�?/P>
分成多个�D�|��什么好处呢�Q�首先，它让�E�序昑־�更加清晰——你肯定更愿意看一个结构清楚的�E�序�Q�代码中hard-coded的字�W�串、数据让��得费解。比如，mov dx, 0152h肯定不如mov dx, offset Message来的亲切。此外，通过分段你可以��用更多的内存�Q�比如，代码�D�腾出的�I�间可以做更多的事情。exe文�g另一个吸引�h的地�Ҏ��它能够实现“重定位”。现在你不需要指定程序入口点的地址了，因�ؓ�pȝ��会找��C��的程序入口点�Q�而不是死板的100h�?/P>
�E�序中的�W�号也会在系�l�加载的时候重新赋予新的地址。exe�E�序能够保证你的设计�Ҏ��地被实现�Q�不需要考虑太多的细节�?/P>
当然�Q�我们的主要目的是将汇编语言作�ؓ高��语言的一个有用的补充。如我在开始提到的那样�Q�真正完全用汇编语言实现的程序不一定就好，因�ؓ它不便于�l�护�Q�而且�Q�由于结构的原因�Q�你也不太容易确保它是正��的�Q�汇�~�语�a�是一�U�非�l�构化的语言�Q�调试一个精心设计的汇编语言�E�序�Q�即使对于一个老手来说也不��L��一场恶梦，因�ؓ你很可能掉到别�h预设的“陷阱”中——这些技巧确实提高了代码性能�Q�然而你很可能不理解它，于是你把它改掉，接着��发现程序彻底��|掉了。��用汇�~�语�a�加强高��语言�E�序�Ӟ��你要做的通常只是使用汇编指��o�Q�而不必搭建完整的汇编�E�序。绝大多敎ͼ�也是目前我遇到的全部�Q�C/C++�~�译器都支持内嵌汇编�Q�即在程序中使用汇编语言�Q�而不必撰写单独的汇编语言�E�序——这可以节省你的不少�_�֊��Q�因为前面讲�q�的那些伪指令，如equ�{�，都可以用你熟悉的高��语言方式来编写，�~�译器会把它转换为适当的�Ş式�?/P>
需要说明的是，在高�U�语�a�中一定要注意�~�译�l�果。编译器会对你的汇编�E�序做一些修改，�q�不一定符合你的要求（附带说一句，有时�~�译器会很聪明地调整指��o��序来提高性能�Q�这�U�情况下最好测试一下哪�U�写法的效果更好�Q�，此时需要做一些更深入的修改，或者用db来强制编码�?/P>
3.2 保护模式

实模式的东西说得太多了，��管我已�l�删掉了许多东西�Q��ƈ把一些原则性的问题拿到了这一节讨论。这样做不是没有理由的——保护模式才是现在的�E�序�Q�除了操作系�l�的底层启动代码�Q�最常用的CPU模式。保护模式提供了很多令�h耳目一新的功能�Q�包括内存保护（�q�是保护模式�q�个名字的来源）、进�E�支持、更大的内存支持�Q�等�{��?/P>
对于一个编�E��h员来��_��能“偷懒”是一件��o人愉快的事情。这里“偷懒”是说把“应该”由�pȝ��做的事情做的事情全都交给�pȝ��。�ؓ什么呢�Q�这��一个基本思想——�h��L��犯错误的时候，然而规则不会，正确��C��解规则之后，你可以期待它像你所了解的那��h��行。对于C�E�序来说�Q�你自己用C语言写的实现相同功能的函数通常没有�pȝ��提供的函数性能好（除非你用了比函数库好很多的算法）�Q�因为系�l�的函数往往使用了更好的优化�Q�甚臛_��能不是用C语言直接�~�写的�?/P>
当然�Q�“偷懒”的意思是��_��把那些应该让机器做的事情交给计算机来做，因�ؓ它做得更好。我们应该把�_�֊�集中到设计算法，而不是编写源代码本��n上，因�ؓ�~�译器几乎只能做�{��h优化�Q�而实现相同功能，但��用更好算法的�E�序实现�Q�则几乎只能�׃�h自己完成�?/P>
举个例子�Q�这样一个函敎ͼ�

int fun(){
int a=0;
register int i;
for(i=0; i<1000; i++) a+=i;
return a;
}

在某�U�编译模式[DEBUG]下被�~�译�?/P>

push ebp
mov ebp,esp
sub esp,48h
push ebx
push esi
push edi
lea edi,[ebp-48h]
mov ecx,12h
mov eax,0CCCCCCCCh
rep stos dword ptr [edi]
mov dword ptr [ebp-4],0
mov dword ptr [ebp-8],0
jmp fun+31h
mov eax,dword ptr [ebp-8]
add eax,1
mov dword ptr [ebp-8],eax
cmp dword ptr [ebp-8],3E8h
jge fun+45h
mov ecx,dword ptr [ebp-4]
add ecx,dword ptr [ebp-8]
mov dword ptr [ebp-4],ecx
jmp fun+28h
mov eax,dword ptr [ebp-4]
pop edi
pop esi
pop ebx
mov esp,ebp
pop ebp
ret ; 子程序入�?/FONT>

; 保护现场

; 初始化变�?调试版本�Ҏ��?BR>; 本质是在堆中挖一块地儿，存CCCCCCCC�?BR>; 用串操作�q�行�Q�这��发挥Intel处理器优�?BR>; ‘a=0�?BR>; ‘i=0�?/FONT>

; 走着
; i++

; i<1000?

; a+=i;

; return a;

; 恢复现场

　

; �q�回

而在另一�U�模式[RELEASE/MINSIZE]下却被编译�ؓ

xor eax,eax
xor ecx,ecx
add eax,ecx
inc ecx
cmp ecx,3E8h
jl fun+4
ret
; a=0;
; i=0;
; a+=i;
; i++;
; i<1000?
; �?>�l�箋�l�箋
; return a

如果让我来写�Q�多半会写成

mov eax, 079f2ch
ret
; return 499500

��Z��么这样写呢？我们看到�Q�i是一个外界不能媄响、也无法��L��的内部状态量。作��D늨�序来��_��对它的计��对于结果�ƈ没有直接的媄响——它的存在不�q�是方便��法描述而已。�ƈ且我们看到的�Q�这�D늨�序实际上无论执行多少�ơ，其结果都不会发生变化�Q�因此，直接�q�回计算�l�果��可以了�Q�计��是多余的（如果说一定要��，那么应该是编译器在编译过�E�中完成它）�?/P>
更进一步，我们甚至希望�~�译器能够直接把�q�个函数变成一个符号常量，�q�样�q�操作堆栈的�q�程也省掉了�?/P>
�W�三�U�结果属于“等效”代码，而不是“等价”代码。作为用��P��很多时候是希望�~�译器这样做的，然而由于目前的技术尚不成熟，有时�q�种做法会造成一些问题（gcc和g++的顶�U�优化可以造成�~�译出的FreeBSD内核行�ؓ异常�Q�这是我在FreeBSD上遇到的唯一一�ơ��Y件原因的kernel panic�Q�，因此�Q��ƈ不是所有的�~�译器都�q�样做（另一斚w��的原因是�Q�如果编译器在这斚w��做的太过火，例如自动求解全部“固定”问题，那么如果你的�E�序是解军_��定的问题“很大”，如求解迷宫，那么在编译过�E�中你就会找锤子来砸计算��Z��Q�。然而，作�ؓ�~�译器制造商�Q��ؓ了提高自��q��产品的竞争力�Q�往往会��用第三种代码来做函数库。正如前面所提到的那��P��q�种优化往往不是�~�译器本�w�的作用�Q�尽��现代编译程序拥有编译执行、��@环代码外提、无用代码去除等诸多优化功能�Q�但它都不能保证�E�序最优。最后一�U�代码恐怕很��有�~�译器能够做刎ͼ�不信你可以用自己常用的编译器加上各种优化选项试试:)

发现什么了吗？三种代码中，对于内存的访问一个比一个少。这样做的理由是�Q�尽可能地利用寄存器�q�减��对内存的访问，可以提高代码性能。在某些情况下，使代码既��又快是可能的�?/P>
书归正传�Q�我们来说说保护模式的内存模型。保护模式的内存和实模式有很多共同之处�?/P>

毫无疑问�Q�以'protected mode'(保护模式), 'global descriptor table'(全局描述�W�表), 'local descriptor table'(本地描述�W�表)�?selector'(选择�?搜烦�Q�你会得到完整介�l�它们的大量信息�?/P>
保护模式与实模式的内存类��|��然而，它们之间最大的区别��是保护模式的内存是“线性”的�?/P>
新的计算��Z��Q?2-bit的寄存器已经不是什么新鲜事�Q�如果你哪天听说你的CPU的寄存器不是32-bit的，那么它——简直可以肯定地说——的字长要比32-bit�q�要多。新的个人机上已�l�开始逐步采用64-bit的CPU了）�Q�换�a�之，实际上段/偏移量这一格局已经不再需要了。尽��如此，在��l�看保护模式内存�l�构�Ӟ��仍请��C��D?偏移量的概念。不妨把�D�寄存器看作对于保护模式中的选择器的一个模拟。选择器是全局描述�W�表(Global Descriptor Table, GDT)或本地描�q�符�?Local Descriptor Table, LDT)的一个指针�?/P>
如图所�C�，GDT和LDT的每一个项目都描述一块内存。例如，一个项目中包含了某块被描述的内存的物理的基地址、长度，以及其他一些相关信息�?/P>
保护模式是一个非帔R��要的概念�Q�同时也是目前撰写应用程序时�Q�最常用的CPU模式�Q�运行在新的计算��Z��的操作系�l�很��有在实模式下运行的�Q��?/P>
��Z��么叫保护模式呢？它“保护”了什么？�{�案是进�E�的内存。保护模式的主要目的在于允许多个�q�程同时�q�行�Q��ƈ保护它们的内存不受其他进�E�的�늊�。这有点�c�M��于C++中的机制�Q�然而它的强制力要大得多。如果你的进�E�在保护模式下以不恰当的方式讉K��了内存（例如�Q�写了“只诠Z��内存，或读了不可读的内存，�{�等�Q�，那么CPU��׃��产生一个异常。这个异常将交给操作�pȝ��处理�Q�而这�U�处理，假如你的�E�序没有特别说明操作�pȝ��该如何处理的话，一般就是杀掉做错了事情的进�E��?/P>
我像�q�样的对话框大家一定非常熟悉（临时写了一个程序故意造成的错误）�Q?/P>

好的�Q�只是一个程序崩溃了�Q�而操作系�l�的其他�q�程照常�q�行�Q�同��L��E�序在DOS中几乎是板上钉钉的死机，因�ؓNULL指针的位�|�恰好是中断向量表）�Q�你甚至�q�可以调试它�?/P>
保护模式�q�有其他很多好处�Q�在此就不一一赘述了。实模式和保护模式之间的切换问题我打��放在后面的“高�U�技巧”一章来�Ԍ��因�ؓ多数�E�序�q�不涉及�q�个�?/P>
了解了内存的格局�Q�我们就可以�q�入下一节——操作内存了�?/P>
3.3 操作内存

前两节中�Q�我们介�l�了实模式和保护模式中��用的不同的内存格局。现在开始解释如何��用这些知识�?/P>
回忆一下前面我们说�q�的�Q�寄存器可以用作内存指针。现在，是他们发挥作用的时候了�?/P>
可以��内存想象�ؓ一个顺序的字节��。��用指针，可以��L��地操作（��d��Q�内存�?/P>
现在我们需要一些其他的指��o格式来描�q�对于内存的操作。操作内存时�Q�首先需要的��是它的地址�?/P>
让我们来看看下面的代码：

mov ax,[0]

�Ҏ��可��C�，里面的表辑ּ�指定的不是立��x��Q�而是偏移量。在实模式中�Q�DS:0中的那个字（16-bit长）��被装入AX�?/P>
然�?是一个常敎ͼ�如果需要在�q�行的时候加以改变，��需要一些特�D�的技巧，比如�E�序自修攏V��汇�~�支持这个特性，然而我个�h�q�不推荐�q�种�Ҏ��——自修改大大降低�E�序的可��L��，�q�且�q�降低稳定性，性能�q�不一定好。我们需要另外的技术�?/P>

mov bx,0
mov ax,[bx]

看�v来舒服了一些，不是吗？BX寄存器的内容可以随时更改�Q�而不需要用冗长的代码去修改自��n�Q�更不用担心由此带来的不�E�_��问题�?/P>
同样的，mov指��o也可以把数据保存到内存中�Q?/P>

mov [0],ax

在存储器与寄存器之间交换数据应该��_��清楚了�?/P>
有些时候我们会需要操作符来描�q�内存数据的宽度�Q?/P>

操作�W?/FONT> 意义

byte ptr 一个字�?8-bit, 1 byte)

word ptr 一个字(16-bit)

dword ptr 一个双�?32-bit)

例如�Q�在DS:100h处保�?234h�Q�以字存放：

mov word ptr [100h],01234h

于是我们��mov指��o扩展为：

mov reg(8,16,32), mem(8,16,32)
mov mem(8,16,32), reg(8,16,32)
mov mem(8,16,32), imm(8,16,32)

需要说明的是，加减同样也可以在[]中��用，例如�Q?/P>

mov ax,[bx+10]
mov ax,[bx+si]
mov ax,es:[di+bp]

�{�等。我们看刎ͼ�对于内存的操作，即��使用MOV指��o�Q�也有许多种可能的方式。下一节中�Q�我们将介绍如何操作丌Ӏ?/P>
感谢 �|�友水杉指出此答案中的一处错误�?BR>感谢 Heallven 指出.COM�E�序实例�~�译��p�|的问�?/P>
2EA8:D678 -> 物理�?3C0F8
694E:175A -> 物理�?6AC4A
26CF:8D5F -> 物理�?2FA4F
2B3C:D218 -> 物理�?385E8
453A:CFAD -> 物理�?5235D
728F:6578 -> 物理�?78E68
2933:31A6 -> 物理�?2C4D6
68E1:A7DC -> 物理�?735FC

�~�程
shl eax,4
add eax,bx

爱饭�?/a> 2005-11-11 13:11 发表评论

使用寄存�?

Fri, 11 Nov 2005 05:09:00 GMT
使用寄存�?/FONT>

2.2 使用寄存�?/H3>
在前一节中的x86基本寄存器的介绍�Q�对于一个汇�~�语�a��~�程人员来说是不可或�~�的。现在你知道�Q�寄存器是处理器内部的一些保存数据的存储单元。仅仅了解这些是不��以写��Z��个可用的汇编语言�E�序的，但你已经可以大致��L��一般汇�~�语�a��E�序了（不必惊讶�Q�因为汇�~�语�a�的祝记符和英文单词非常接�q�）�Q�因��Z��已经了解了关于基本寄存器的绝大多数知识�?/P>
在正式引入第一个汇�~�语�a��E�序之前�Q�我�_�略��C��l�一下汇�~�语�a�中不同进制整数的表示�Ҏ��。如果你不了解十�q�制以外的其他进�Ӟ��h��鼠标�U�d��?SPAN class=tip id=oRadixes>�q�里�?/P>

　　汇编语言中的整数帔R��表示

十进制整�?BR>�q�是汇编器默认的数制。直接用我们熟悉的表�C�方式表�C�即可。例如，1234表示十进制的1234。不�q�，如果你指定了使用其他数制�Q�或者有凡事都进行完整定义的��爱好，也可以写成[十进制数]d或[十进制数]D的�Ş式�?
十六�q�制�?BR>�q�是汇编�E�序中最常用的数�Ӟ��我个人比较偏�׃��用十六进制表�C�数据，至于��Z��么，以后我会作说明。十六进制数表示�?[十六�q�制数]h�?[十六�q�制数]H�Q�其中，如果十六�q�制数的�W�一位是数字�Q�则开头的0可以省略。例如，7fffh, 0ffffh�Q�等�{��?
二进制数
�q�也是一�U�常用的数制。二�q�制数表�C�Zؓ[二进制数]b或[二进制数]B。一般程序中用二�q�制数表�C�掩码（mask code�Q�等数据非常的直观，但需要些很长的数据（4位二�q�制数相当于一位十六进制数�Q�。例如，1010110b�?
八进制数
八进制数现在已经不是很常用了�Q�确实还在用�Q�一个典型的例子是Unix的文件属性）。八�q�制数的形式是[八进制数]q、[八进制数]Q、[八进制数]o、[八进制数]O。例如，777Q�?/LI>

需要说明的是，�q�些�Ҏ��是针对宏汇编器（例如�Q�MASM、TASM、NASM�Q�说的，调试器默认��用十六进制表�C�整敎ͼ��q�且不需要特别的声明�Q�例如，在调试器中直接用FFFF表示十进制的65535�Q�用10表示十进制的16�Q��?/P>
现在我们来写一��段汇编�E�序�Q�修改EAX、EBX、ECX、EDX的数倹{�?/P>
我们假定�E�序执行之前�Q�寄存器中的数值是�?�Q?/P>

　 ? X

H L

EAX 0000 00 00

EBX 0000 00 00

ECX 0000 00 00

EDX 0000 00 00

正如前面提到的，EAX的高16bit是没有办法直接访问的�Q�而AX对应它的�?6bit�Q�AH、AL分别对应AX的高、低8bit�?/P>

mov eax, 012345678h
mov ebx, 0abcdeffeh
mov ecx, 1
mov edx, 2 ; ��?12345678h送入eax
; ��?abcdeffeh送入ebx
; ��?00000001h送入ecx
; ��?00000002h送入edx

则执行上�q�程序段之后�Q�寄存器的内容变为：

　 ? X

H L

EAX 1234 56 78

EBX abcd ef fe

ECX 0000 00 01

EDX 0000 00 02

那么�Q�你已经了解了mov�q�个指��o�Q�mov是move的羃写）的一�U�用法。它可以��数送到寄存器中。我们来看看下面的代码：

mov eax, ebx
mov ecx, edx ; ebx内容送入eax
; edx内容送入ecx

则寄存器内容变�ؓ�Q?/P>

　 ? X

H L

EAX abcd ef fe

EBX abcd ef fe

ECX 0000 00 02

EDX 0000 00 02

我们可以看到�Q�“move”之后，数据依然保存在原来的寄存器中。不妨把mov指��o理解为“送入”，或“装入”�?/P>
�l�习�?/B>

把寄存器恢复成都为全0的状态，然后执行下面的代码：

mov eax, 0a1234h
mov bx, ax
mov ah, bl
mov al, bh ; ��?a1234h送入eax
; ��ax的内定w��入bx
; ��bl内容送入ah
; ��bh内容送入al

思考：此时�Q�EAX的内容将是多��？[�{�案]

下面我们��介�l�一些指令。在介绍指��o之前�Q�我们约定：

　　 使用Intel文档中的寄存器表�C�方�?/B>

reg32 32-bit寄存器（表示EAX、EBX�{�）
reg16 16-bit寄存器（�?2位处理器中，�q�AX、BX�{�）
reg8 8-bit寄存器（表示AL、BH�{�）
imm32 32-bit立即敎ͼ�可以理解为常敎ͼ�
imm16 16-bit立即�?
imm8 8-bit立即�?/LI>

在寄存器中蝲入另一寄存器，或立��x��的��|��

mov reg32, (reg32 | imm8 | imm16 | imm32)
mov reg32, (reg16 | imm8 | imm16)
mov reg8, (reg8 | imm8)

例如�Q�mov eax, 010h表示�Q�在eax中蝲�?0000010h。需要注意的是，如果你希望在寄存器中装入0�Q�则有一�U�更快的�Ҏ��Q�在后面我们��提到�?/P>
交换寄存器的内容�Q?/P>

xchg reg32, reg32
xchg reg16, reg16
xchg reg8, reg8

例如�Q�xchg ebx, ecx�Q�则ebx与ecx的数值将被交换。由于系�l�提供了�q�个指��o�Q�因此，采用其他�Ҏ��交换�Ӟ��速度��会较慢�Q��ƈ需要占用更多的存储�I�间�Q�编�E�时要避免这�U�情况，卻I��量利用�pȝ��提供的指令，因�ؓ多数情况下，�q�意味着更小、更快的代码�Q�同时也杜绝了错误（如果说Intel的CPU在交换寄存器内容的时候也会出错，那么它就不用卖CPU了。而对于你来说�Q�检查一行代码的正确性也昄��比检查更多代码的正确性要�Ҏ��Q�刚才的习题的程序用下面的代码将更有效：

mov eax, 0a1234h
mov bx, ax
xchg ah, al ; ��?a1234h送入eax
; ��ax内容送入bx
; 交换ah, al的内�?/FONT>

递增或递减寄存器的��|��

inc reg(8,16,32)
dec reg(8,16,32)

�q�两个指令往往用于循环中对指针的操作。需要说明的是，某些时候我们有更好的方法来处理循环�Q�例如��用loop指��o�Q�或rep前缀。这些将在后面的章节中介�l��?/P>
��寄存器的数��g��另一寄存器，或立��x��的值相加，�q�存回此寄存器：

add reg32, reg32 / imm(8,16,32)
add reg16, reg16 / imm(8,16)
add reg8, reg8 / imm(8)

例如�Q�add eax, edx�Q�将eax+edx的值存入eax。减法指令和加法�c�M��Q�只是将add换成sub�?/P>
需要说明的是，与高�U�语�a�不同�Q�汇�~�语�a�中，如果要计��两��C��和（差、积、商�Q�或一般地��_��q�算�l�果�Q�，那么必然有一个寄存器被用来保存结果。在PASCAL中，我们可以用nA := nB + nC来让nA保存nB+nC的结果，然而，汇编语言�q�不提供�q�种�Ҏ��。如果你希望保持寄存器中的结果，需要用另外的指令。这也从另一个侧面反映了“寄存器”这个名字的意义。数据只是“寄存”在那里。如果你需要保存数据，那么需要将它放到内存或其他地方�?/P>
�c�M��的指令还有and、or、xor�Q�与�Q�或�Q�异或）�{�等。它们进行的是逻辑�q�算�?/P>
我们�U�add、mov、sub、and�{�称��Zؓ指��o助记�W�（�q�么叫是因�ؓ它比机器语言�Ҏ��记忆�Q�而�v作用��是方便��忆，某些资料中也�U�Cؓ指��o、操作码、opcode[operation code]�{�）�Q�后面的参数成�ؓ操作敎ͼ�一个指令可以没有操作数�Q�也可以有一两个操作敎ͼ�通常有一个操作数的指令，�q�个操作数就是它的操作对象；而两个参数的指��o�Q�前一个操作数一般是保存操作�l�果的地方，而后一个是附加的参数�?/P>
我不打算在这份教�E�中用大量的��幅介绍指��o——很多�h做得比我更好�Q�而且指��o本��n�q�不是重点，如果你学会了如何�l�织语句�Q�那么只要稍加学习就能轻易掌握其他指令。更多的指��o可以参�?A >Intel提供的资料。编写程序的时候，也可以参考一些在�U�参考手册。Tech!Help和HelpPC 2.10��管已经很旧�Q�但��以应付�l�大多数需要�?/P>
聪明的读者也许已�l�发玎ͼ�使用sub eax, eax�Q�或者xor eax, eax�Q�可以得��C��mov eax, 0�c�M��的效果。在高��语言中，你大概不会选择用a=a-a来给a赋��|��因�ؓ��试会告诉你�q�么做更慢，��直就是在自找�ȝ��Q�然而在汇编语言中，你会得到相反的结论，多数情况下，以由快到慢的速度排列�Q�这三条指��o��是xor eax, eax、sub eax, eax和mov eax, 0�?/P>
��Z��么呢�Q�处理器在执行指令时�Q�需要经�q�几个不同的阶段�Q�取指、译码、取数、执行�?/P>
我们反复��Q�寄存器是CPU的一部分。从寄存器取敎ͼ�光��度很显然要比从内存中取数快。那么，不难理解�Q�xor eax, eax要比mov eax, 0更快一些�?/P>
那么�Q��ؓ什么a=a-a通常要比a=0慢一些呢�Q�这和编译器的优化有一定关�p�R��多数编译器会把a=a-a��译成类��g��面的代码(通常�Q�高�U�语�a�通过ebp和偏�U�量来访问局部变量；�E�序中，x为a相对于本地堆的偏�U�量�Q�在只包含一�?2-bit整�Ş变量的程序中�Q�这个值通常�?)�Q?/P>

mov eax, dword ptr [ebp-x]
sub eax, dword ptr [ebp-x]
mov dword ptr [ebp-x],eax

而把a=0��译�?/P>

mov dword ptr [ebp-x], 0

上面的翻译只是示意性的�Q�略��M��很多必要的步骤，如保护寄存器内容、恢复等�{�。如果你对与�~�译�E�序的实现过�E�感兴趣�Q�可以参考相应的书籍。多数编译器�Q�特别是C/C++�~�译器，如Microsoft Visual C++�Q�都提供了从源代码到宏汇�~�语�a��E�序的附加编译输出选项。这�U�情况下�Q�你可以很方便地了解�~�译�E�序执行的输出结果；如果�~�译�E�序没有提供�q�样的功能也没有关系�Q�调试器会让你看到编译器的编译结果�?/P>
如果你明��地知道�~�译器编译出的结果不是最优的�Q�那��可以着手用汇编语言来重写那�D�代码了。怎么��认是否应该用汇�~�语�a�重写呢？

　　使用汇编语言重写代码之前需要确认的几�g事情

首先�Q�这�U�优�?B>最�?/B>�?B>明显的效�?/B>。比如，一�D��@环中的计��，�{�等。一条语句的执行旉��是很短的�Q�现在新的CPU的指令周期都�?.000000001s以下�Q�Intel甚至已经做出�?GHz主频�Q�主频的倒数是时钟周期）的CPU�Q�如果你的代码自始至�l�只执行一�ơ，�q�且你只是减��了几个旉��周期的执行时��_��那么改变��是无法让�h察觉的；很多情况下，�q�种“优化”�ƈ不被提倡，��管它确实减��了执行旉��Q�但为此需要付出大量的旉��、�h力，多数情况下得不偿失（极端情况�Q�比如你的设备内存�h格非常昂�늚�时候，�q�种优化也许会有意义�Q��?
其次�Q�确认你已经使用�?B>最好的��法�Q��ƈ且，你优化的�E�序的实现是正确的。汇�~�语�a�能够提供同样��法的最快实玎ͼ�然而，它�ƈ不是万金油，更不是解决一切的灵丹妙药。用高��语言实现一�U�好的算法，不一定会比汇�~�语�a�实现一�U�差的算法更慢。不�q�需要注意的是，旉��、空间复杂度最��的��法不一定就是解��x��一特定问题的最佳算法。�D例说�Q�快速排序在完全逆序的情况下�{��h于冒泡排序，�q�时其他�Ҏ��比它快。同�Ӟ��用汇�~�语�a�优化一个不正确的算法实玎ͼ��给调试带来很大的麻烦�?
最后，��认�?B>已经��高�U�语�a��~�译器的性能发挥到极�?/B>。Microsoft的编译器在RELEASE模式和DEBUG模式会有差异相当大的输出�Q�而对于GNU�p�d��的编译器而言�Q�不同��别的优化也会生成几乎完全不同的代码。此外，在编�E�时对于问题的严格定义，可以极大地帮助编译器的优化过�E�。如何优化高�U�语�a�代码�Q��其编译结果最优超��Z��本教�E�的范围�Q�但如果你不能确认已�l�发挥了�~�译器的最大效能，用汇�~�语�a�往往是一�U�更��力的�Ҏ��?
�q�有一炚w��帔R��要，那就是你明白自己做的是什么�?/B>好的高��语言�~�译器有时会有一些让人难以理解的行�ؓ�Q�比如，重新排列指��o��序�Q�等�{�。如果你发现�q�种情况�Q�那么优化的时候就应该��心——编译器很可能比你拥有更多的关于处理器的知识�Q�例如，对于一个超标量处理器，�~�译器会�Ҏ��令序列进行“封包”，使他们尽可能的�ƈ行执行；此外�Q�宏汇编器有时会自动插入一些nop指��o�Q�其作用是将指��o凑成整数字长�Q?2-bit�Q�对�?6-bit处理器，�?6-bit�Q�。这些都是提高代码性能的必要措施，如果你不了解处理器，那么最好不要改动编译器生成的代码，因�ؓ�q�种情况下，盲目的修改往往不会得到预期的效果�?/LI>

曄��在一份杂志上看到�q�有人用�U�机器语�a��~�写�E�序。不清楚到底�q�是不是�~�辑的失误，因�ؓ一个头脑正常的人恐怕不会这么做�E�序�Q�即使它不长、也不复杂。首先，汇编器能够完成某些封包操作，即��不行�Q�也可以用db伪指令来写指令；用汇�~�语�a�写程序可以防止很多错误的发生�Q�同�Ӟ��它还减轻了�h的负担，很显�Ӟ��“完全用机器语言写程序”是完全没有必要的，因�ؓ汇编语言可以做出完全一��L��事情�Q��ƈ且你可以依赖它，因�ؓ计算��Z��会出错，而�h��L��出错的时候。此外，如前面所�a��Q�如果用高��语言实现�E�序的代价不大（例如�Q�这�D�代码在�E�序的整个执行过�E�中只执行一遍，�q�且�Q�这一遍的执行旉��也小于一�U�）�Q�那么，��Z��么不用高�U�语�a�实现呢？

一些比较狂热的�~�程爱好者可能不太喜�Ƣ我的这�U�观炏V��比方说�Q�他们可能希望精益求�_�֜�优化每一字节的代码。但多数情况下我们有更重要的事情�Q�例如，你的��法是最优的吗？你已�l�把�E�序在高�U�语�a�许可的范围内优化到尽头了吗？�q�不是所有的人都有资��D��栯��。汇�~�语�a�是这样一件东西，它��够的强大�Q�能够控制计��机�Q�完成它能够实现的�Q何功能；同时�Q�因为它的强大，也会提高开发成本，�q�且�Q�难于维护。因此，我个人的��是，如果在��Y件开发中使用汇编语言�Q�则应在软�g接近完成的时候��用，�q�样可以减少很多不必要的投入�?/P>
�W�二章中�Q�我介绍了x86�p�d��处理器的基本寄存器。这些寄存器对于x86兼容处理器仍然是有效的，如果你偏爱AMD的CPU�Q�那么��用这些寄存器的程序同样也可以正常�q�行�?/P>
不过现在说用汇编语言�q�行优化�q��ؓ时尚早——不可能写程序，而只操作�q�些寄存器，因�ؓ�q�样只能完成非常��单的操作�Q�既然是��单的操作�Q�那可能��׃��让�h觉得乏味�Q�甚��x��一台��够快的机器穷丑֮�的所有结果（如果可以�I��D的话�Q�，�q�直接写�E�序调用�Q�因��样通常会更快。但话说回来�Q�看完接下来的两章——内存和堆栈操作�Q�你��可以独立完成几乎所有的��d��了，配合�W�五章中断、第六章子程序的知识�Q�你��知道如何驾驭处理器�Q��ƈ让它��Z��工作�?/P>数字计算机内�?B>只支�?/B>二进制数�Q�因��栯��机
只需要表�C�Z��U?某些情况�?�U�，�q�一内容��过�?BR>�q�䆾教程的范��_��如果您感兴趣�Q�可以参考数字�?BR>辑电路的相关书籍)状�? 对于电�\而言�Q�这表现
为高、低电��^�Q�或者开、关�Q�分别非常明显，因�?BR>工作比较�E�_��Q�另一斚w��Q�由于只有两�U�状态，�?BR>计�v来也比较��单。这��P��使用二进制意味着低成
本、稳定，多数情况下，�q�也意味着快速�?

与十�q�制�c�M��Q�我们可以用下面的式子来换算��Z��
个�Q意�Ş如a_m-1……a₃a₂a₁a₀的m位r�q�制数对应的
数值n�Q?/P>

�E�序设计中常用十六进制和八进制数字代替二�q�制
敎ͼ�其原因在于，16�?�?的整�ơ方�q�，�q�样�Q�一
位十六或八进制数可以表示整数个二�q�制位。十�?BR>�q�制中，使用字母A、B、C、D、E、F表示10-15�Q?BR>而十六进制或八进制数制表�C�的的数字比二进制数
更短一些�?/P>
EAX的内容�ؓ000A3412h.

爱饭�?/a> 2005-11-11 13:09 发表评论

寄存�?

Fri, 11 Nov 2005 05:06:00 GMT

1. 通用寄存�?/FONT>:

EAX

(accumulator)"累加�?,很多加法乘法指��o的缺�?FONT style="BACKGROUND-COLOR: #316ac5" color=#ffffff>寄存�?/FONT>.

EBX

(base)"基地址"寄存�?/FONT>, 在内存寻址时存攑֟�地址.

ECX

(counter)计数�? 是重�?REP)前缀指��o和LOOP指��o的内定计�?/P>
EDX

用来放整数除法��生的余数.

�?6�?AX,BX,CX和DX

�?�?:AL,BL,CL和DL

�?�?:AH,BH,CH和DH

ESI

(source index)"源烦�?FONT style="BACKGROUND-COLOR: #316ac5" color=#ffffff>寄存�?/FONT>", DS:ESI指向源串,�?字符串操作指令中,

EDI

(destination index)"目标索引寄存�?/FONT>",ES:EDI指向目标�?/P>
EBP

(BASE POINTER)"基址指针",被用作高�U�语�a�函数调用�?BR>

,ESP(�q�个虽然通用,�?BR>很少被用做除了堆栈指针外的用�? �q�些32位可以被用作多种4�?FONT style="BACKGROUND-COLOR: #316ac5" color=#ffffff>寄存�?/FONT>的又�?/P>
函数的返回值经常被攑֜�EAX�? ESI/EDI分别叫做"�?目标索引寄存�?/FONT>"(source/destination index

),因�ؓ在很多字�W�串操作指��o�? DS:ESI指向源串,�? EBP�?基址指针"(BASE POINTER), 它最�l�常"

框架指针"(frame pointer). 在破解的时�?�l�常可以看见一个标准的函数起始代码: push ebp ;保存当前ebp mov ebp,esp ;EBP设�ؓ当前堆栈指针

sub esp, xxx ;预留xxx字节�l�函��C��时变�? ... �q�样一�?EBP 构成了该函数的一个框�? 在EBP上方分别是原来的EBP, �q�回地址和参�? EBP�?BR>
方则是��时变�? 函数�q�回时作 mov esp,ebp/pop ebp/ret 卛_��. ESP 专门用作堆栈指针. 2. �D?FONT style="BACKGROUND-COLOR: #316ac5" color=#ffffff>寄存�?/FONT>: CS(Code Segment�Q�代码段) 指定当前�?BR>
行的代码�D? EIP (Instruction pointer, 指��o指针)则指向该�D�中一个具体的指��o. CS:EIP指向哪个指��o, CPU ��执行它. 一般只能用jmp, ret,

jnz, call �{�指令来改变�E�序��程,而不能直接对它们赋�? DS(DATA SEGMENT, 数据�D? 指定一个数据段. 注意:在当前的计算机系�l�中, 代码和数

据没有本质差�? 都是一串二�q�制�? 区别只在于你如何用它. 例如, CS 制定的段��L��被用作代�? 一般不能通过CS指定的地址��M��改该�D? 然�?BR>
,你可以�ؓ同一个段甌��一个数据段描述�W?别名"而通过DS来访�?修改. 自修改代码的�E�序常如此做. ES,FS,GS 是辅助的�D?FONT style="BACKGROUND-COLOR: #316ac5" color=#ffffff>寄存�?/FONT>, 指定附加的数

据段. SS(STACK SEGMENT)指定当前堆栈�D? ESP 则指��D�中当前的堆栈顶. 所有push/pop �p�d��指��o都只对SS:ESP指出的地址�q�行操作. 3. 标志

寄存�?/FONT>(EFLAGS): �?FONT style="BACKGROUND-COLOR: #316ac5" color=#ffffff>寄存�?/FONT>�?2�?�l�合了各个系�l�标�? EFLAGS一般不作�ؓ整体讉K��, 而只对单一的标志位感兴��? 常用的标志有: �q�位标志C(

CARRY), 在加法��生进位或减法有借位时置1, 否则�?. 零标志Z(ZERO), 若运��结果�ؓ0则置1, 否则�? �W�号位S(SIGN), 若运��结果的最高位�|?BR>
1, 则该位也�|?. 溢出标志O(OVERFLOW), �?带符�?�q�算�l�果��出可表�C��? 则置1. JXX �p�d��指��o��是�Ҏ��q�些标志来决定是否要跌��{, 从�?BR>
实现条�g分枝. 要注�?很多JXX 指��o是等��L��, 对应相同的机器码. 例如, JE 和JZ 是一��L��,都是当Z=1是蟩�? 只有JMP 是无条�g跌��{. JXX �?BR>
令分��Z��l? 分别用于无符��h��作和带符��h��? JXX 后面�?XX" 有如下字�? 无符��h��? 带符��h��? A = "ABOVE", 表示"高于" G = "

GREATER", 表示"大于" B = "BELOW", 表示"低于" L = "LESS", 表示"��于" C = "CARRY", 表示"�q�位"�?借位" O = "OVERFLOW", 表示"溢出" S

= "SIGN", 表示"�? 通用�W�号: E = "EQUAL" 表示"�{�于", �{��h于Z (ZERO) N = "NOT" 表示"�?, ��x��志没有置�? 如JNZ "如果Z没有�|�位则蟩

�? Z = "ZERO", 与E�? 如果仔细想一�?��׃��发现 JA = JNBE, JAE = JNB, JBE = JNA, JG = JNLE, JGE= JNL, JL= JNGE, .... 4. 端口端口

是直接和外部讑֤�通讯的地斏V��外设接入系�l�后�Q�系�l�就会把外设的数据接口映��到特定的端口地址�I�间�Q�这��P��从该端口��d��数据��是从外设读

入数据，而向外设写入数据��是向端口写入数据。当然这一切都必须遵��@外设的工作方式。端口的地址�I�间与内存地址�I�间无关�Q�系�l��d��提供�?BR>
64K�?位端口的讉K��Q�编�?-65535. 盔R��?位端口可以组成成一�?6位端口，盔R��?6位端口可以组成一�?2位端口。端口输入输出由指��o

IN,OUT,INS和OUTS实现�Q�具体可参考汇�~�语�a�书籍�?BR>

中央处理�?CPU)在微机系�l�处于“领导核心”的��C��。汇�~�语�a�被编译成机器语言之后�Q�将由处理器来执行。那么，首先让我们来了解一下处理器的主要作用，�q�将帮助你更好地��N��它�?/P>

典型的处理器的主要�Q务包�?/B>

从内存中获取机器语言指��o�Q�译码，执行
�Ҏ��指��o代码��理它自��q��寄存�?
�Ҏ��指��o或自��q��的需要修改内存的内容
响应其他��g的中断请�?

一般说来，处理器拥有对整个�pȝ��的所有�ȝ��的控制权。对于Intel�q�_��而言�Q�处理器拥有�Ҏ��据、内存和控制�ȝ��的控制权�Q�根据指令控制整个计��机的运行。在以后的章节中�Q�我们还��讨论系�l�中同时存在多个处理器的情况�?/P>
处理器中有一些寄存器�Q�这些寄存器可以保存特定长度的数据。某些寄存器中保存的数据对于�pȝ��的运行有�Ҏ��的意义�?/P>
新的处理器往往拥有更多、具有更大字长的寄存器，提供更灵�zȝ��取指、寻址方式�?/P>
寄存�?/B>

如前所�q�ͼ�处理器中有一些可以保存数据的地方被称作寄存器�?/P>
寄存器可以被装入数据�Q�你也可以在不同的寄存器之间�U�d��q�些数据�Q�或者做�c�M��的事情。基本上�Q�像四则�q�算、位�q�算�{�这些计��操作，都主要是针对寄存器进行的�?/P>
首先让我来介�l�一�?0386上最常用�?个通用寄存器。先瞧瞧下面的图形，试着理解一下：

上图中，数字表示的是位。我们可以看出，EAX是一�?2-bit寄存器。同�Ӟ��它的�?6-bit又可以通过AX�q�个名字来访问；AX又被分�ؓ高、低8bit两部分，分别由AH和AL来表�C��?/P>
对于EAX、AX、AH、AL的改变同时也会媄响与被修改的那些寄存器的倹{��从而事实上只存在一�?2-bit的寄存器EAX�Q�而它可以通过4�U�不同的途径讉K��?/P>
也许通过名字能够更容易地理解�q�些寄存器之间的关系。EAX中的E的意思是“扩展的”，整个EAX的意思是扩展的AX。X的意思Intel没有明示�Q�我个�h认�ؓ表示它是一个可变的�?。而AH、AL中的H和L分别代表高和�?�?/P>
��Z��么要�q�么做呢�Q�主要由于历史原因。早期的计算机是8位的�Q?086是第一�?6位处理器�Q�其通用寄存器的名字是AX�Q�BX�{�等�Q?0386是Intel推出的第一�ƾIA-32�p�d��处理器，所有的寄存器都被扩充�ؓ32位。�ؓ了能够兼容以前的16位应用程序，80386不能��这些寄存器依旧命名为AX、BX�Q��ƈ且简单地��他们扩充�ؓ32位——这��增加处理器在处理指令方面的成本�?/P>
Intel微处理器的寄存器列表�Q�在本章先只介绍80386的寄存器�Q�MMX寄存器以及其他新一代处理器的新寄存器将在以后的章节介绍�Q?/P>
通用寄存�?/B>
下面介绍通用寄存器及其习惯用法。顾名思义�Q�通用寄存器是那些你可以根据自��q��意愿使用的寄存器�Q�修改他们的值通常不会对计��机的运行造成很大的媄响。通用寄存器最多的用途是计算�?/P>

EAX
32-bit�?/P>
通用寄存器。相对其他寄存器�Q�在�q�行�q�算斚w��比较常用。在保护模式中，也可以作为内存偏�U�L��针（此时�Q�DS作�ؓ�D?寄存器或选择器）

EBX
32-bit�?/P>
通用寄存器。通常作�ؓ内存偏移指针使用�Q�相对于EAX、ECX、EDX�Q�，DS是默认的�D�寄存器或选择器。在保护模式中，同样可以赯��个作用�?/TD>

ECX
32-bit�?/P>
通用寄存器。通常用于特定指��o的计数。在保护模式中，也可以作为内存偏�U�L��针（此时�Q�DS作�ؓ 寄存器或�D�选择器）�?/TD>

EDX
32-bit�?/P>
通用寄存器。在某些�q�算中作为EAX的溢出寄存器�Q�例如乘、除�Q�。在保护模式中，也可以作为内存偏�U�L��针（此时�Q�DS作�ؓ�D?寄存器或选择器）�?/TD>

上述寄存器同EAX一样包括对应的16-bit�?-bit分组�?/P>
用作内存指针的特�D�寄存器

ESI
32-bit�?
通常在内存操作指令中作�ؓ“源地址指针”��用。当�Ӟ��ESI可以被装入�Q意的数��|��但通常没有人把它当作通用寄存器来用。DS是默认段寄存器或选择器�?/TD>

EDI
32-bit�?/P>
通常在内存操作指令中作�ؓ“目的地址指针”��用。当�Ӟ��EDI也可以被装入��L��的数��|��但通常没有人把它当作通用寄存器来用。DS是默认段寄存器或选择器�?/TD>

EBP
32-bit�?/P>
�q�也是一个作为指针的寄存器。通常�Q�它被高�U�语�a��~�译器用以徏造‘堆栈��’来保存函数或过�E�的局部变量，不过�Q�还是那句话�Q�你可以在其中保存你希望的�Q何数据。SS是它的默认段寄存器或选择器�?/TD>

注意�Q�这三个寄存器没有对应的8-bit分组。换�a�之，你可以通过SI、DI、BP作�ؓ别名讉K��他们的低16位，却没有办法直接访问他们的�?位�?/P>
�D�寄存器和选择�?/B>

实模式下的段寄存器到保护模式下摇�w�一变就成了选择器。不同的是，实模式下的“段寄存器”是16-bit的，而保护模式下的选择器是32-bit的�?/P>

CS 代码�D�，或代码选择器。同IP寄存�?�E�后介绍)一同指向当前正在执行的那个地址。处理器执行时从�q�个寄存器指向的�D�（实模式）或内存（保护模式�Q�中获取指��o。除了蟩转或其他分支指��o之外�Q�你无法修改�q�个寄存器的内容�?/TD>

DS 数据�D�，或数据选择器。这个寄存器的低16 bit�q�同ESI一同指向的指��o��要处理的内存。同�Ӟ��所有的内存操作指��o 默认情况下都用它指定操作�D?实模�?或内�?作�ؓ选择器，在保护模式。这个寄存器可以被装入�Q意数��|��然而在�q�么做的时候需要小心一些。方法是�Q�首先把数据送给AX�Q�然后再把它从AX传送给DS(当然�Q�也可以通过堆栈来做).

ES 附加�D�，或附加选择器。这个寄存器的低16 bit�q�同EDI一同指向的指��o��要处理的内存。同��L��Q�这个寄存器可以被装入�Q意数��|��Ҏ��和DS�c�M��?/TD>

FS F�D�|��F选择�?推测F可能是Free?)。可以用�q�个寄存器作为默认段寄存器或选择器的一个替代品。它可以被装入�Q何数��|��Ҏ��和DS�c�M��?/TD>

GS G�D�|��G选择�?G的意义和F一��P��没有在Intel的文档中解释)。它和FS几乎完全一栗��?/TD>

SS 堆栈�D�|��堆栈选择器。这个寄存器的低16 bit�q�同ESP一同指向下一�ơ堆栈操�?push和pop)所要��用的堆栈地址。这个寄存器也可以被装入��L��数��|��你可以通过入栈和出栈操作来�l�他赋��|��不过�׃��堆栈对于很多操作有很重要的意义，因此�Q�不正确的修�Ҏ��可能造成对堆栈的破坏�?/TD>

* 注意一定不要在初学汇编的阶�D�|��q�些寄存器弄淗��他们非帔R��要，而一旦你掌握了他们，你就可以对他们做��L��的操作了。段寄存器，或选择器，在没有指定的情况下都是��用默认的那个。这句话在现在看来可能有点稀里糊涂，不过你很快就会在后面知道如何��d��?/P>
�Ҏ��寄存�?指向到特定段或内存的偏移�?�Q?/P>

EIP �q�个寄存器非常的重要。这是一�?2位宽的寄存器 �Q�同CS一同指向即��执行的那条指��o的地址。不能够直接修改�q�个寄存器的��|��修改它的唯一�Ҏ��是蟩转或分支指��o�?CS是默认的�D�|��选择�?

ESP �q�个32位寄存器指向堆栈中即��被操作的那个地址。尽��可以修改它的��|��然而�ƈ不提倡这样做�Q�因为如果你不是非常明白自己在做什么，那么你可能造成堆栈的破坏。对于绝大多数情况而言�Q�这对程序是致命的�?SS是默认的�D�|��选择�?

IP: Instruction Pointer, 指��o指针
SP: Stack Pointer, 堆栈指针

好了�Q�上面是最基本的寄存器。下面是一些其他的寄存器，你甚臛_��能没有听说过它们�?都是32位宽)�Q?/P>
CR0, CR2, CR3(控制寄存�?。�D一个例子，CR0的作用是切换实模式和保护模式�?/P>
�q�有其他一些寄存器�Q�D0, D1, D2, D3, D6和D7(调试寄存�?。他们可以作��试器的硬件支持来讄��条�g断点�?/P>
TR3, TR4, TR5, TR6 �?TR? 寄存�?��试寄存�?用于某些条�g��试�?/P>
最后我们要说的是一个在�E�序设计中�v着非常关键的作用的寄存器：标志寄存器�?/P>

爱饭�?/a> 2005-11-11 13:06 发表评论

Thu, 03 Nov 2005 03:30:00 GMT
                                                  预处理过�E?/STRONG>

预处理过�E�扫描源代码�Q�对其进行初步的转换�Q��生新的源代码提供�l�编译器。可见预处理�q�程先于�~�译器对源代码进行处理�?SPAN lang=EN-US>
�?SPAN lang=EN-US>C语言中，�q�没有�Q何内在的机制来完成如下一些功能：在编译时包含其他源文件、定义宏、根据条件决定编译时是否包含某些代码。要完成�q�些工作�Q�就需要��用预处理�E�序。尽��在目前�l�大多数�~�译器都包含了预处理�E�序�Q�但通常认�ؓ它们是独立于�~�译器的。预处理�q�程��d��源代码，��查包含预处理指��o的语句和宏定义，�q�对源代码进行响应的转换。预处理�q�程�q�会删除�E�序中的注释和多余的�I�白字符�?SPAN lang=EN-US>
预处理指令是�?SPAN lang=EN-US>#号开头的代码行�?SPAN lang=EN-US>#号必��L��该行除了��M��I�白字符外的�W�一个字�W��?SPAN lang=EN-US>#后是指��o关键字，在关键字�?SPAN lang=EN-US>#号之间允许存在�Q意个数的�I�白字符。整行语句构成了一条预处理指��o�Q�该指��o��在�~�译器进行编译之前对源代码做某些转换。下面是部分预处理指令：

        指��o             用�?SPAN lang=EN-US>
         #           �I�指令，无�Q何效�?SPAN lang=EN-US>
         #include    包含一个源代码文�g
         #define     定义�?SPAN lang=EN-US>
         #undef      取消已定义的�?SPAN lang=EN-US>
         #if         如果�l�定条�g为真�Q�则�~�译下面代码
         #ifdef      如果宏已�l�定义，则编译下面代�?SPAN lang=EN-US>
         #ifndef     如果宏没有定义，则编译下面代�?SPAN lang=EN-US>
         #elif       如果前面�?SPAN lang=EN-US>#if�l�定条�g不�ؓ真，当前条�g为真�Q�则�~�译下面代码
         #endif      �l�束一�?SPAN lang=EN-US>#if…�?SPAN lang=EN-US>#else条�g�~�译�?SPAN lang=EN-US>
         #error      停止�~�译�q�显�C�错误信�?SPAN lang=EN-US>

一、文件包�?SPAN lang=EN-US>
    #include预处理指令的作用是在指��o处展开被包含的文�g。包含可以是多重的，也就是说一个被包含的文件中�q�可以包含其他文件。标�?SPAN lang=EN-US>C�~�译器至��支持八重嵌套包含�?SPAN lang=EN-US>
    预处理过�E�不��查在转换单元中是否已�l�包含了某个文�g�q��止对它的多次包含。这样就可以在多�ơ包含同一个头文�g�Ӟ��通过�l�定�~�译时的条�g来达��C��同的效果。例如：

        #define AAA
        #include "t.c"
        #undef AAA
        #include "t.c"

    ��Z��避免那些只能包含一�ơ的头文件被多次包含�Q�可以在头文件中用编译时条�g来进行控制。例如：
        /*my.h*/
        #ifndef MY_H
        #define MY_H
          …�?SPAN lang=EN-US>
        #endif

    在程序中包含头文件有两种格式�Q?SPAN lang=EN-US>
        #include
        #include "my.h"
    �W�一�U�方法是用尖括号把头文�g括�v来。这�U�格式告诉预处理�E�序在编译器自带的或外部库的头文件中搜烦被包含的头文件。第二种�Ҏ��是用双引��h��头文件括��h��。这�U�格式告诉预处理�E�序在当前被�~�译的应用程序的源代码文件中搜烦被包含的头文�Ӟ��如果找不刎ͼ�再搜索编译器自带的头文�g�?SPAN lang=EN-US>
    采用两种不同包含格式的理由在于，�~�译器是安装在公共子目录下的�Q�而被�~�译的应用程序是在它们自��q��U�有子目录下的。一个应用程序既包含�~�译器提供的公共头文�Ӟ��也包含自定义的私有头文�g。采用两�U�不同的包含格式使得�~�译器能够在很多头文件中区别��Z��l�公��q��头文件�?SPAN lang=EN-US>

二、宏
    宏定义了一个代表特定内容的标识�W�。预处理�q�程会把源代码中出现的宏标识�W�替换成宏定义时的倹{��宏最常见的用法是定义代表某个值的全局�W�号。宏的第二种用法是定义带参数的宏�Q�这��L��宏可以象函数一栯��调用�Q�但它是在调用语句处展开宏，�q�用调用时的实际参数来代替定义中的�Ş式参数�?SPAN lang=EN-US>
    1.#define指��o
        #define预处理指令是用来定义宏的。该指��o最��单的格式是：首先��明一个标识符�Q�然后给��个标识符代表的代码。在后面的源代码中，��q��q�些代码来替代该标识�W�。这�U�宏把程序中要用到的一些全局值提取出来，赋给一些记忆标识符�?SPAN lang=EN-US>
            #define MAX_NUM 10
            int array[MAX_NUM];
            for(i=0;i…�?SPAN lang=EN-US>*/

        在这个例子中�Q�对于阅读该�E�序的�h来说�Q�符�?SPAN lang=EN-US>MAX_NUM��有特定的含义，它代表的值给��Z��数组所能容�U�的最大元素数目。程序中可以多次使用�q�个倹{��作��Z��U�约定，习惯上��L��全部用大写字母来定义宏，�q�样易于把程序红的宏标识�W�和一般变量标识符区别开来。如果想要改变数�l�的大小�Q�只需要更改宏定义�q��新编译程序即可�?SPAN lang=EN-US>
        宏表�C�的值可以是一个常量表辑ּ��Q�其中允许包括前面已�l�定义的宏标识符。例如：
            #define ONE 1
            #define TWO 2
            #define THREE (ONE+TWO)
        注意上面的宏定义使用了括受��尽��它们�ƈ不是必须的。但��Z��谨慎考虑�Q�还是应该加上括��L��。例如：
            six=THREE*TWO;
        预处理过�E�把上面的一行代码�{换成�Q?SPAN lang=EN-US>
            six=(ONE+TWO)*TWO;
        如果没有那个括号�Q�就转换�?SPAN lang=EN-US>six=ONE+TWO*TWO;了�?SPAN lang=EN-US>
        宏还可以代表一个字�W�串帔R��Q�例如：
            #define VERSION "Version 1.0 Copyright(c) 2003"
    2.带参数的#define指��o
        带参数的宏和函数调用看�v来有些相伹{��看一个例子：
            #define Cube(x) (x)*(x)*(x)
        可以时�Q何数字表辑ּ�甚至函数调用来代替参�?SPAN lang=EN-US>x。这里再�ơ提醒大家注意括��L��使用。宏展开后完全包含在一�Ҏ��号中�Q�而且参数也包含在括号中，�q�样��׃��证了宏和参数的完整性。看一个用法：
            int num=8+2;
            volume=Cube(num);
        展开后�ؓ(8+2)*(8+2)*(8+2);
        如果没有那些括号��变�?SPAN lang=EN-US>8+2*8+2*8+2了�?SPAN lang=EN-US>
        下面的用法是不安全的�Q?SPAN lang=EN-US>
            volume=Cube(num++);
        如果Cube是一个函敎ͼ�上面的写法是可以理解的。但是，因�ؓCube是一个宏�Q�所以会产生副作用。这里的擦书不是��单的表达式，它们��生意想不到的�l�果。它们展开后是�q�样的：
            volume=(num++)*(num++)*(num++);
        很显�Ӟ��l�果�?SPAN lang=EN-US>10*11*12,而不�?SPAN lang=EN-US>10*10*10;
        那么怎样安全的��?SPAN lang=EN-US>Cube宏呢�Q�必��L��可能产生副作用的操作�U�d��宏调用的外面�q�行�Q?SPAN lang=EN-US>
            int num=8+2;
            volume=Cube(num);
            num++;
    3.#�q�算�W?SPAN lang=EN-US>
        出现在宏定义中的#�q�算�W�把跟在其后的参数�{换成一个字�W�串。有时把�q�种用法�?SPAN lang=EN-US>#�U�Cؓ字符串化�q�算�W�。例如：

            #define PASTE(n) "adhfkj"#n

            main()
            {
               printf("%s\n",PASTE(15));
            }
        宏定义中�?SPAN lang=EN-US>#�q�算�W�告诉预处理�E�序�Q�把源代码中��M��传递给该宏的参数�{换成一个字�W�串。所以输出应该是adhfkj15�?SPAN lang=EN-US>
    4.##�q�算�W?SPAN lang=EN-US>
        ##�q�算�W�用于把参数�q�接��C��赗��预处理�E�序把出现在##两侧的参数合�q�成一个符受��看下面的例子：

            #define NUM(a,b,c) a##b##c
            #define STR(a,b,c) a##b##c

            main()
            {
                printf("%d\n",NUM(1,2,3));
                printf("%s\n",STR("aa","bb","cc"));
            }

        最后程序的输出�?SPAN lang=EN-US>:
                 123
                 aabbcc
        千万别担心，除非需要或者宏的用法恰好和手头的工作相养I��否则很少有程序员会知�?SPAN lang=EN-US>##�q�算�W�。绝大多数程序员从来没用�q�它�?SPAN lang=EN-US>

三、条件编译指�?SPAN lang=EN-US>
    条�g�~�译指��o��决定那些代码被�~�译�Q�而哪些是不被�~�译的。可以根据表辑ּ�的值或者某个特定的宏是否被定义来确定编译条件�?SPAN lang=EN-US>
    1.#if指��o
        #if指��o��跟在制造另关键字后的常量表辑ּ�。如果表辑ּ�为真�Q�则�~�译后面的代码，知道出现#else�?SPAN lang=EN-US>#elif�?SPAN lang=EN-US>#endif为止�Q�否则就不编译�?SPAN lang=EN-US>
    2.#endif指��o
        #endif用于�l�止#if预处理指令�?SPAN lang=EN-US>

            #define DEBUG 0
            main()
            {
                #if DEBUG
                    printf("Debugging\n");
                #endif
                    printf("Running\n");
            }

        �׃��E�序定义DEBUG宏代�?SPAN lang=EN-US>0�Q�所�?SPAN lang=EN-US>#if条�g为假�Q�不�~�译后面的代码直�?SPAN lang=EN-US>#endif�Q�所以程序直接输�?SPAN lang=EN-US>Running�?SPAN lang=EN-US>
        如果��L��#define语句�Q�效果是一��L��?SPAN lang=EN-US>
    3.#ifdef�?SPAN lang=EN-US>#ifndef
        #define DEBUG

        main()
        {
            #ifdef DEBUG
                printf("yes\n");
            #endif
            #ifndef DEBUG
                printf("no\n");
            #endif
        }
        #if defined�{��h�?SPAN lang=EN-US>#ifdef; #if !defined�{��h�?SPAN lang=EN-US>#ifndef
    4.#else指��o
        #else指��o用于某个#if指��o之后�Q�当前面�?SPAN lang=EN-US>#if指��o的条件不为真�Ӟ��q��?SPAN lang=EN-US>#else后面的代码�?SPAN lang=EN-US>#endif指��o��中指上面的条�g块�?SPAN lang=EN-US>

        #define DEBUG

        main()
        {
            #ifdef DEBUG
                printf("Debugging\n");
            #else
                printf("Not debugging\n");
            #endif
                printf("Running\n");
       }

    5.#elif指��o
        #elif预处理指令综合了#else�?SPAN lang=EN-US>#if指��o的作用�?SPAN lang=EN-US>

        #define TWO

        main()
        {
            #ifdef ONE
                printf("1\n");
            #elif defined TWO
                printf("2\n");
            #else
                printf("3\n");
            #endif
        }
        �E�序很好理解�Q�最后输出结果是2�?SPAN lang=EN-US>

    6.其他一些标准指�?SPAN lang=EN-US>
        #error指��o��ɾ~�译器显�C�Z��条错误信息，然后停止�~�译�?SPAN lang=EN-US>
        #line指��o可以改变�~�译器用来指��告和错误信息的文件号和行受��?SPAN lang=EN-US>
        #pragma指��o没有正式的定义。编译器可以自定义其用途。典型的用法是禁止或允许某些烦�h的警告信息�?/SPAN>

爱饭�?/a> 2005-11-03 11:30 发表评论

EAX 32-bit�?/P>	通用寄存器。相对其他寄存器�Q�在�q�行�q�算斚w��比较常用。在保护模式中，也可以作为内存偏�U�L��针（此时�Q�DS作�ؓ�D?寄存器或选择器）
EBX 32-bit�?/P>	通用寄存器。通常作�ؓ内存偏移指针使用�Q�相对于EAX、ECX、EDX�Q�，DS是默认的�D�寄存器或选择器。在保护模式中，同样可以赯��个作用�?/TD>
ECX 32-bit�?/P>	通用寄存器。通常用于特定指��o的计数。在保护模式中，也可以作为内存偏�U�L��针（此时�Q�DS作�ؓ 寄存器或�D�选择器）�?/TD>
EDX 32-bit�?/P>	通用寄存器。在某些�q�算中作为EAX的溢出寄存器�Q�例如乘、除�Q�。在保护模式中，也可以作为内存偏�U�L��针（此时�Q�DS作�ؓ�D?寄存器或选择器）�?/TD>

ESI 32-bit�?	通常在内存操作指令中作�ؓ“源地址指针”��用。当�Ӟ��ESI可以被装入�Q意的数��\|��但通常没有人把它当作通用寄存器来用。DS是默认段寄存器或选择器�?/TD>
EDI 32-bit�?/P>	通常在内存操作指令中作�ؓ“目的地址指针”��用。当�Ӟ��EDI也可以被装入��L��的数��\|��但通常没有人把它当作通用寄存器来用。DS是默认段寄存器或选择器�?/TD>
EBP 32-bit�?/P>	�q�也是一个作为指针的寄存器。通常�Q�它被高�U�语�a��~�译器用以徏造‘堆栈��’来保存函数或过�E�的局部变量，不过�Q�还是那句话�Q�你可以在其中保存你希望的�Q何数据。SS是它的默认段寄存器或选择器�?/TD>

CS	代码�D�，或代码选择器。同IP寄存�?�E�后介绍)一同指向当前正在执行的那个地址。处理器执行时从�q�个寄存器指向的�D�（实模式）或内存（保护模式�Q�中获取指��o。除了蟩转或其他分支指��o之外�Q�你无法修改�q�个寄存器的内容�?/TD>
DS	数据�D�，或数据选择器。这个寄存器的低16 bit�q�同ESI一同指向的指��o��要处理的内存。同�Ӟ��所有的内存操作指��o 默认情况下都用它指定操作�D?实模�?或内�?作�ؓ选择器，在保护模式。这个寄存器可以被装入�Q意数��\|��然而在�q�么做的时候需要小心一些。方法是�Q�首先把数据送给AX�Q�然后再把它从AX传送给DS(当然�Q�也可以通过堆栈来做).
ES	附加�D�，或附加选择器。这个寄存器的低16 bit�q�同EDI一同指向的指��o��要处理的内存。同��L��Q�这个寄存器可以被装入�Q意数��\|��Ҏ��和DS�c�M��?/TD>
FS	F�D�\|��F选择�?推测F可能是Free?)。可以用�q�个寄存器作为默认段寄存器或选择器的一个替代品。它可以被装入�Q何数��\|��Ҏ��和DS�c�M��?/TD>
GS	G�D�\|��G选择�?G的意义和F一��P��没有在Intel的文档中解释)。它和FS几乎完全一栗��?/TD>
SS	堆栈�D�\|��堆栈选择器。这个寄存器的低16 bit�q�同ESP一同指向下一�ơ堆栈操�?push和pop)所要��用的堆栈地址。这个寄存器也可以被装入��L��数��\|��你可以通过入栈和出栈操作来�l�他赋��\|��不过�׃��堆栈对于很多操作有很重要的意义，因此�Q�不正确的修�Ҏ��可能造成对堆栈的破坏�?/TD>

EIP	�q�个寄存器非常的重要。这是一�?2位宽的寄存器 �Q�同CS一同指向即��执行的那条指��o的地址。不能够直接修改�q�个寄存器的��\|��修改它的唯一�Ҏ��是蟩转或分支指��o�?CS是默认的�D�\|��选择�?
ESP	�q�个32位寄存器指向堆栈中即��被操作的那个地址。尽��可以修改它的��\|��然而�ƈ不提倡这样做�Q�因为如果你不是非常明白自己在做什么，那么你可能造成堆栈的破坏。对于绝大多数情况而言�Q�这对程序是致命的�?SS是默认的�D�\|��选择�?