国产午夜精品在线观看,欧美日本中文,欧美视频亚洲视频

�E�序员常用字�?vs2008字体修改�Ҏ��)

Hero — Wed, 25 Nov 2009 04:01:00 GMT

字体不仅是设计师手中重要的武器，�Ҏ��们开发�h员来��_��字体的选择也有许多讲究�Q�一个好的、适合展示代码的字体，应该具备以下要素�Q?/p>

�{�宽的字�W?
��z�、清晰�ƈ且规范的字符形状
支持ASCII码�ؓ128以上的扩展字�W�集
与字�W�同�{�宽度的�I�格
易于分��L的小写字母l、大写字母I、数�?和符号|
易于分��L的大写字母O和数�?
易于分��L的前引号和后引号�Q�最好能够前后对�U?
易于分��L的其他标点符��P��其是大括号、中括号、小括号和尖括号
良好的中文支持和昄��

下图展示了一个极端的反例�Q�虽然很有个性，但�ƈ不适合用来昄��代码。它的大写字母大的可怕，��写字母却小的可怜；字符不仅不清晎ͼ�而且不规范；��写字母l、大写字母I、数�?和符号| 难以分��L�Q�大写字母O和数�?难以分��L�Q�标点符可��凑合�Q�只是下划线��Z��么是断开的？

当然�Q�这个反例的��有些夸张，但其上文所列�D的条件是比较苛刻的，我们在选择字体时没有必要非要完全满��x��有条�Ӟ��事实上这�U�字体也是凤毛麟角。下文所分��n的一些字体也�q�没有完全满��x��有条�Ӟ��我们发现�Q�只要满��了其中一些关键条�Ӟ��用来昄��代码��已�l�很不错了�?/p>

在Visual Studio中，更改�~�辑器的字体是�g��单的事情�Q�选择菜单�?strong>工具】�?strong>选项】，在弹出的“选项”对话框中依次选择“环境”�?#8220;字体和颜�?/strong>”�Q�然后在“昄��其设�|?/strong>”中选择“文本�~�辑�?/strong>”�Q�最后在“字体”中选择字体��可以了�Q�如下图所�C�：

在上图中�Q�我们发现Visual Studio已经��等宽字体用�_�体标识了出来，�q�样做是��Z��让我们更�Ҏ��扑ֈ��{�宽的字体，�q�不表示�{�宽字体��׃��定适合昄��代码�Q�比如下图所�C�的“新宋�?#8221;��是一个反例：

在新宋体中，数字0之比大写字母O瘦那么一点点�Q�小写字母l和数�?也十分相像，�q怺�配色�Ҏ��能够颜色��它们区别开来，否则实在难以分��L。这也从另一个角度说明了配色�Ҏ��与字体是相辅相成的，搭配恰当�Ӟ��会让代码更加清晰易��L�?/p>
下面��和大家分��n一些在�~�程界声名烜赫的字体�Q�截图所采用的配色方案�ؓHumaneStudio�Q�展�C�顺序�ؓ字体首字母升序。这些字体可能乍一看都一��P��但仔�l�品呻I��q�是能够发现不同的味道，希望大家都能扑ֈ�适合自己的字体�?/p>
Andale Mono�Q�演�C�字号�ؓ14�Q?a >猛击�q�里下蝲�Q?/p>

Anonymous Pro�Q�演�C�字号�ؓ14�Q?a >猛击�q�里下蝲�Q?/p>

Bitstream Vera Sans Mono�Q�演�C�字号�ؓ14�Q?a >猛击�q�里下蝲�Q?/p>

Consolas�Q�演�C�字号�ؓ14�Q�Windows或Visual Studio已内�|�：

Courier New�Q�演�C�字号�ؓ14�Q�Windows已内�|�：

DejaVu Sans Mono�Q�演�C�字号�ؓ14�Q?a >猛击�q�里下蝲�Q?/p>

Envy Code R�Q�演�C�字号�ؓ16�Q?a >猛击�q�里下蝲�Q?/p>

Inconsolata�Q�演�C�字号�ؓ16�Q?a >猛击�q�里下蝲�Q?/p>

Monaco�Q�演�C�字号�ؓ12�Q?a >猛击�q�里下蝲�Q?/p>

Monofur�Q�演�C�字号�ؓ16�Q?a >猛击�q�里下蝲�Q?/p>

Progmata�Q�演�C�字号�ؓ14�Q?a >猛击�q�里下蝲�Q?/p>

Share TechMono�Q�演�C�字号�ؓ16�Q?a >猛击�q�里下蝲�Q?/p>
注：此字体似乎会��连在一��L��fl昄��Z��个点�Q�不��使用�Q�可惜可惜�?/p>

��注�Q?/p>

本文所分��n的字体均支持ClearType�?
从评论来看，中文的显�C�的��是一个媄响美观的重要因素�Q�所以��生了许多微��Y雅黑和一些优�U�英文字体的�؜合版�Q�但其实�q�有一�U�方法可以快速而简单的实现用不同的字体昄��中英文（感谢DiryBoy提醒�Q�，�Ҏ��如下�Q?

用文本编辑器打开%AppData%\Microsoft\VisualStudio\9.0\VsFontLk.dat�Q?
��?804一行修改�ؓ需要的中文字体�Q�格式�ؓ“0804|中文字体名称”�Q�比�?#8220;0804|微��Y雅黑”�Q?

Hero 2009-11-25 12:01 发表评论

Hero — Tue, 17 Nov 2009 06:14:00 GMT
版本控制比较普遍�?3 �U�命名格�?:

　　一、GNU 风格的版本号命名格式 :

　　�ȝ��本号 . 子版本号 [. 修正版本�?[. �~�译版本�?]]

　　英文对照 : Major_Version_Number.Minor_Version_Number[.Revision_Number[.Build_Number]]

　　�C�Z�� : 1.2.1, 2.0, 5.0.0 build-13124

　　二、Windows 风格的版本号命名格式 :

　　�ȝ��本号 . 子版本号 [ 修正版本�?[. �~�译版本�?]]

　　英文对照 : Major_Version_Number.Minor_Version_Number[Revision_Number[.Build_Number]]

　　�C�Z��: 1.21, 2.0

　　三�?Net Framework 风格的版本号命名格式:

　　�ȝ��本号.子版本号[.�~�译版本号[.修正版本号]]

　　英文对照: Major_Version_Number.Minor_Version_Number[.Build_Number[.Revision_Number]]

　　版本��L��二至四个部分�l�成�Q�主版本受��次版本受��内部版本号和修订号。主版本号和�ơ版本号是必选的�Q�内部版本号和修订号是可选的�Q�但是如果定义了修订号部分，则内部版本号��是必选的。所有定义的部分都必��L��大于或等�?0 的整数�?

　　应根据下面的�U�定使用�q�些部分�Q?

　　Major �Q�具有相同名�U�C��不同�ȝ��本号的程序集不可互换。例如，�q�适用于对产品的大量重写，�q�些重写使得无法实现向后兼容性�?

　　Minor �Q�如果两个程序集的名�U�和�ȝ��本号相同�Q�而次版本号不同，�q�指�C�显著增强，但照��ֈ�了向后兼�Ҏ��。例如，�q�适用于��品的修正版或完全向后兼容的新版本�?

　　Build �Q�内部版本号的不同表�C�对相同源所作的重新�~�译。这适合于更改处理器、��^台或�~�译器的情况�?

　　Revision �Q�名�U�、主版本号和�ơ版本号都相同但修订号不同的�E�序集应是完全可互换的。这适用于修复以前发布的�E�序集中的安全漏�z��?

　　�E�序集的只有内部版本��h��修订号不同的后箋版本被认为是先前版本的修补程�?(Hotfix) 更新�?

　　版本��L��理策�?

　　一�?GNU 风格的版本号��理�{�略�Q?

　　1�Q�项目初版本�?, 版本号可以�ؓ 0.1 �?0.1.0, 也可以�ؓ 1.0 �?1.0.0, 如果你�ؓ人很低调 , 我想你会选择那个�ȝ��本号�?0 的方�?;

　　2�Q�当��目在进行了局部修�Ҏ�� bug 修正�?, �ȝ��本号和子版本号都不变 , 修正版本号加 1;

　　3. 当项目在原有的基��上增加了部分功能�?, �ȝ��本号不变 , 子版本号�?1, 修正版本号复位�ؓ 0, 因而可以被忽略�?;

　　4�Q�当��目在进行了重大修改或局部修正篏�U�较�?, 而导致项目整体发生全局变化�?, �ȝ��本号�?1;

　　5�Q�另�?, �~�译版本号一般是�~�译器在�~�译�q�程中自动生成的 , 我们只定义其格式 , �q�不�q�行��Zؓ控制 .

　　二�?Window 下的版本��L��理策略：

　　1�Q�目初版�?, 版本号�ؓ 1.0 �?1.00;

　　2. 当项目在�q�行了局部修�Ҏ�� bug 修正�Ӟ��ȝ��本号和子版本号都不变 , 修正版本号加 1;

　　3. 当项目在原有的基��上增加了部分功能�?, �ȝ��本号不变 , 子版本号�?1, 修正版本号复位�ؓ 0, 因而可以被忽略�?;

　　4. 当项目在�q�行了重大修�Ҏ��局部修正篏�U�较�?, 而导致项目整体发生全局变化�?, �ȝ��本号�?1;

　　5. 另外 , �~�译版本号一般是�~�译器在�~�译�q�程中自动生成的 , 我们只定义其格式 , �q�不�q�行��Zؓ控制 .

　　另外 , �q�可以在版本号后面加�?Alpha, Beta, Gamma, Current, RC (Release Candidate), Release, Stable �{�后�~� , 在这后缀后面�q�可以加�?1 位数字的版本�?.

　　对于用户来说 , 如果某个软�g的主版本可��行了升�� , 用户�q�想�l�箋那个软�g , 则发行��Y件的公司一般要对用��h��取升�U�费�?; 而如果子版本��h��修正版本号发生了升�� , 一般来说是免费�?.

附： alphal 内部��试�?
　　 beta 外部��试�?
　　 demo 演示�?
　　 Enhance 增强版或者加强版属于正式�?
　　 Free 自由�?
　　 Full version 完全�?属于正式�?
　　 shareware �׃�n�?
　　 Release 发行�?有时间限�?
　　 Upgrade 升��?
　　 Retail 零售�?
　　 Cardware 属共享��Y件的一�U�，只要�l�作者回复一��电邮或明信片即可。（有的作者�ƈ由此提供注册码等�Q�，目前�q�种形式已不多见�?
　　 Plus 属增强版�Q�不�q�这�U�大部分是在�E�序界面及多媒体功能上增强�?
　　 Preview 预览�?
　　 Corporation & Enterprise 企业�?
　　 Standard 标准�?
　　 Mini �q�你版也叫精��版只有最基本的功�?
　　 Premium �?贵�h�?
　　 Professional �?专业�?
　　 Express �?特别�?
　　 Deluxe �?豪华�?
　　 Regged �?已注册版
　　 CN �?��体中文版
　　 CHT �?�J�体中文�?
　　 EN �?英文�?
　　 Multilanguage �?多语�a��?

　　注释�Q?

　　α�?

　　此版本表�C��软�g仅仅是一个初步完成品�Q�通常只在软�g开发者内部交��，也有很少一部分发布�l�专业测试�h员。一般而言�Q�该版本软�g�?bug 较多�Q�普通用��h��好不要安装�?

　　β�Q�beta�Q�版

　　该版本相对于α版已有了很大的改�q�，消除了严重的错误�Q�但�q�是存在着一些缺��P��需要经�q�大规模的发布测试来�q�一步消除。这一版本通常��p�Y件公司免费发布，用户可从相关的站点下载。通过一些专业爱好者的��试�Q�将�l�果反馈�l�开发者，开发者们再进行有针对性的修改。该版本也不适合一般用户安装�?

　　γ�?

　　该版本已�l�相当成熟了�Q�与卛_��发行的正式版相差无几�Q�如果用户实在等不及了，��可以装上一试�?

　　trial�Q�试用版�Q?

　　试用版��Y件在最�q�的几年里颇为流行，主要是得益于互联�|�的�q�速发展。该版本软�g通常都有旉��限制�Q�过期之后用户如果希望��l��用，一般得交纳一定的费用�q�行注册或购买。有些试用版软�g�q�在功能上做了一定的限制�?

　　unregistered�Q�未注册版）

　　未注册版与试用版极其�c�M��Q�只是未注册版通常没有旉��限制�Q�在功能上相对于正式版做了一定的限制�Q�例如绝大多数网�l�电话��Y件的注册版和未注册版�Q�两者之间在通话质量上有很大差距。还有些虽然在��用上与正式版毫无二致�Q�但是动不动��׃��弹出一个恼人的消息框来提醒你注册，如看图��Y�?acdsee 、智能陈桥汉字输入��Y件等�?

　　demo�?

　　也称为演�C�版�Q�在非正式版软�g中，该版本的知名度最大�?demo 版仅仅集成了正式版中的几个功能，颇有点像 unregistered 。不同的是， demo 版一般不能通过升��或注册的�Ҏ��变�ؓ正式版�?

　　以上是��Y件正式版本推��Z��前的几个版本�Q?#945;�?#946;�?#947;可以�U�Cؓ��试版，大凡成熟软�g��M��有多个测试版�Q�如 windows 98 �?#946;版，前前后后��近�?10 个。这么多的测试版一斚w��Z��最�l��品尽可能地满��用��L��需要，另一斚w��也尽量减��了软�g中的 bug 。�?trial �?unregistered �?demo 有时�l�称为演�C�版�Q�这一�cȝ��本的�q�告色彩较浓�Q�颇有点先尝后买的味道，对于普通用戯��言自然是可以免费尝鲜了�?

　　正式版　不同�c�d��的��Y件的正式版本通常也有区别�?

　　release

　　该版本意�?#8220;最�l�释攄��”�Q�在��Z��一�p�d��的测试版之后�Q�终归会有一个正式版本，对于用户而言�Q�购买该版本的��Y件绝对不会错。该版本有时也称为标准版�?一般情况下�Q?release 不会以单词�Ş式出现在软�g��面上，取而代之的是符�?(r) �Q�如 windows nt(r) 4.0 �?ms-dos(r) 6.22 �{��?

　　registered

　　很显�Ӟ��该版本是�?unregistered 相对的注册版。注册版�?release 和下面所讲的 standard 版一��P��都是软�g的正式版本，只是注册版��Y件的前��n有很大一部分是从�|�上下蝲的�?

　　standard

　　�q�是最常见的标准版�Q�不论是什么��Y�Ӟ��标准版一定存在。标准版中包含了该��Y件的基本�l��g及一些常用功能，可以满��一般用��L��需求。其��h��相对高一�U�版本而言�q�是“�q�x��q��h”的�?

　　deluxe

　　��֐�思义即�ؓ“豪华�?#8221;。豪华版通常是相对于标准版而言的，主要区别是多了几��功能，��h��当然会高��Z��大块�Q�不推荐一般用戯��买。此版本通常是�ؓ那些�q�求“完美”的专业用��h��准备的�?

　　reference

　　该版本型号常见于癄��全书中，比较有名的是微��Y�?encarta �p�d��?reference 是最高��别，其包含的主题、图像、媄片剪辑等相对�?standard �?deluxe 版均有大�q�增加，定w��׃��张光盘猛增至三张光盘�Q��ƈ且加入了很强的交互功能，当然��h��也不菌Ӏ�可以这么说�Q�这一版本的百�U�全书才能算是真正的癄��全书�Q�也是发烧友们收藏的首选�?

　　professional�Q�专业版�Q?

　　专业版是针对某些特定的开发工兯��Y件而言的。专业版中有许多内容是标准版中所没有的，�q�些内容对于一个专业的软�g开发�h员来说是极�ؓ重要的。如微��Y�?visual foxpro 标准版�ƈ不具备编译成可执行文件的功能�Q�这对于一个完整的开发项目而言昄��是无法忍受的�Q�若客户��Z��没有 foxpro ��不能��用。如果用专业版就没有�q�个问题了�?

　　enterprise�Q�企业版�Q?

　　企业版是开发类软�g中的极品�Q�相当于癄��全书中的 reference 版）。拥有一套这�U�版本的软�g可以毫无障碍地开发�Q何��别的应用软�g。如著名�?visual c++ 的企业版相对于专业版来说增加了几个附加的�Ҏ��，�?sql 调试、扩展的存储�q�程向导、支�?as/400 �?ole db 的访问等。而这一版本的�h��g��是普通用��h��法接受的。如微��Y�?visual studios 6.0 enterprise 中文版的��h��?23000 元�?

　　其他版本　除了以上介绍的一些版本外�Q�还有一些专有版本名�U��?

　　update�Q�升�U�版�Q?

　　升��版的软�g是不能独立��用的�Q�该版本的��Y件在安装�q�程中会搜烦原有的正式版�Q�如果不存在�Q�则拒绝执行下一步。如 microsoft office 2000 升��版�?windows 9x 升��版等�{��?

　　OEM�?

　　OEM版通常是捆�l�在��g中而不单独销售的版本。将自己的��品交�l�别的公司去卖，保留自己的著作权�Q�双方互惠互利，一举两得�?

　　单机�Q�网�l�）�?

　　�|�络版在功能、结构上�q�比单机版复杂，如果留心一下��Y件的报�h�Q�你��׃��发现某些软�g单机版和�|�络版的��h��相差非常大，有些�|�络版甚臛_��一个客��L��口就要加不少钱�?

　　普及�?

　　该版本有时也会被�U�Cؓ�׃�n版，其特�Ҏ��h��便宜�Q�有些甚臛_��全免费）、功能单一、针�Ҏ��强�Q�当然也有占领市场、打�ȝ��版等因素�Q�。与试用版不同的是，该版本的软�g一般不会有旉��上的限制。当�Ӟ��如果用户惛_��U�，最好还是去购买正式版�?

　　以上是一些常见��Y件版本的��要介�l�，随着软�g市场行�ؓ的变化，现在也出��C��一些新的版本命名方式，比如windows xp中的xp是取自于experience中的�W�二、第三个字母。希望以上内容能够对大家的购买、��用和下蝲软�g有所帮助�?

　　��Z��商业上考虑�Q�很多的软�g都不是非�怸�谨的遵��@�q�个规则的。最有名的就是微软了。例如他�?NT �p�d��版本。大家比较熟悉的是从 NT 4.0 开始的�?99 �q�推��Z�� windows 2000 �Q?2001 �q�退��Z�� windows xp �Q?2003 �q�推��Z�� windows 2003 �Q�乍一看版本区别蛮大的�Q�但是看他们的内部版本号��׃��发现�Q�变化其实�ƈ不大�Q�只是界面变化的大了而已。这是��Y件公司经常干的事情�?Window 2000 的版本号�?NT 5.0 �Q?windows xp 的版本号�?NT 5.1 �Q?windows 2003 的版本号�?NT 5.2 �Q�而现在的 longhorn 才是真正�?NT 6.0 �Q�印象中是，不敢��认�Q�。这样就可以持箋的赚�q�大客户的钱。毕竟�h的眼睛看得东西是最直观的，所以给人感觉也是变化最大的�?/p>

Hero 2009-11-17 14:14 发表评论

javascript [转蝲]

Hero — Fri, 14 Aug 2009 06:35:00 GMT
     摘要: 今天在网上看��C��介�l�javascript的文章，文采真是没的��_��能将本来枯燥的程序讲�q�的如此酣畅淋漓实在让�h佩服�Q?来源 �Q�http://blog.csdn.net/gisfarmer/archive/2009/02/13/3885515.aspx 引子     �~�程世界里只存在两种基本元素�Q�一个是数据�Q�一个是代码。编�E�世界就是在�?..  阅读全文

Hero 2009-08-14 14:35 发表评论

Hero — Tue, 28 Jul 2009 06:07:00 GMT

1 #!/usr/bin/env python
2 #
3 #       getDirSize.py
4 #
5 #       Copyright 2009 Hiro
6 #
7 #       This program is free software; you can redistribute it and/or modify
8 #       it under the terms of the GNU General Public License as published by
9 #       the Free Software Foundation; either version 2 of the License, or
10 #       (at your option) any later version.
11 #
12 #       This program is distributed in the hope that it will be useful,
13 #       but WITHOUT ANY WARRANTY; without even the implied warranty of
14 #       MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 #       GNU General Public License for more details.
16 #
17 #       You should have received a copy of the GNU General Public License
18 #       along with this program; if not, write to the Free Software
19 #       Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston,
20 #       MA 02110-1301, USA.
21
22 import os
23 from os.path import join, getsize
24
25 def getDirSize( dir ):
26     size = 0L
27     for root, dirs, files in os.walk(dir):
28         size += sum( [getsize(join(root, name)) for name in files] )
29     return size
30
31 def main():
32
33     filesize = getDirSize( "/home/wangzr" )
34     print ( "there are %0.3f" %(filesize/1024/1024), "Mb in /home/wangzr" )
35
36     return 0
37
38 if __name__ == '__main__': main()
39

Hero 2009-07-28 14:07 发表评论

Hero — Tue, 28 Jul 2009 06:07:00 GMT

1 #!/usr/bin/env python
2 #
3 #       getDirSize2.py
4 #
5 #       Copyright 2009 Hiro
6 #
7 #       This program is free software; you can redistribute it and/or modify
8 #       it under the terms of the GNU General Public License as published by
9 #       the Free Software Foundation; either version 2 of the License, or
10 #       (at your option) any later version.
11 #
12 #       This program is distributed in the hope that it will be useful,
13 #       but WITHOUT ANY WARRANTY; without even the implied warranty of
14 #       MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 #       GNU General Public License for more details.
16 #
17 #       You should have received a copy of the GNU General Public License
18 #       along with this program; if not, write to the Free Software
19 #       Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston,
20 #       MA 02110-1301, USA.
21
22
23 import os
24 #from os import listdir
25
26 def getDirSize( source ) :
27     size = 0L
28     if os.path.isfile( source ) :
29         size += os.stat( source )[6]
30     elif os.path.isdir( source ) :
31         for src in os.listdir( source ) :
32             srcpath = os.path.join( source, src )
33             print srcpath
34             size += getDirSize( srcpath )
35
36     return size
37
38 def main():
39
40     dirname = r"/home/wangzr"
41     print getDirSize( dirname ) / 1024 /1024
42     return 0
43
44 if __name__ == '__main__': main()
45

Hero 2009-07-28 14:07 发表评论

[转蝲] python中文�~�码问题

Hero — Fri, 24 Jul 2009 06:30:00 GMT

Unicode 是一个系�l�，用来表示世界上所有不同语�a�的字�W�。当 Python 解析一�?XML 文档�Ӟ��所有的数据都是以unicode的�Ş式保存在内存中的�?/p>

一会儿你就会了解，但首先，先看一些背景知识�?/p>
历史注解. �?unicode 之前�Q�对于每一�U�语�a�都存在独立的字符�~�码�pȝ��Q�每个系�l�都使用相同的数�?0-255)来表�C��U�语�a�的字�W�。一些语�a� (像俄�? 对于如何表示相同的字�W�还有几�U�有冲突的标准；另一些语�a� (像日�? 拥有太多的字�W�，需要多个字�W�集。在�pȝ��之间�q�行文档交流是困隄��Q�因为对于一台计��机来说�Q�没有方法可以识别出文档的作者��用了哪种�~�码模式�Q�计��机�?到的只是数字�Q��ƈ且这些数字可以表�C�Z��同的东西。接着考虑到试囑ְ��q�些 (采用不同�~�码�? 文档存放到同一个地�?(比如在同一个数据库表中)�Q�你需要在每段文本的旁边保存字�W�的�~�码�Q��ƈ且确保在传递文本的同时��编码也�q�行传递。接着考虑多语�a�文档�Q�即在同一文档中�� 用了不同语言的字�W��?比较有代表性的是��用�{义符来进行模式切换；噗，我们处于俄语 koi8-r 模式�Q�所以字�W?241 表示�q�个�Q�噗�Q�现在我们处�?Mac 希腊语模式，所以字�W?241 表示其它什么。等�{��? �q�些��是 unicode 被设计出来要解决的问题�?/p>
��Z��解决�q�些问题�Q�unicode 用一�?2 字节数字表示每个字符�Q�从 0 �?65535�?sup>[8] 每个 2 字节数字表示臛_��在一�U�世界语�a�中��用的一个唯一字符�?在多�U�语�a�中都使用的字�W�具有相同的数字码�? �q�样��q��保每个字�W�一个数字，�q�且每个数字一个字�W�。Unicode 数据永远不会模棱两可�?/p>
当然�Q�仍然还存在着所有那些遗留的�~�码�pȝ��的情��c��例如，7 �?ASCII�Q�它可以��英文字�W�存��ؓ�?0 �?127 的数倹{�?65 是大写字�?“A”�Q?7 是小写字�?“a”�Q�等�{��? ��p��有着非常��单的字母表，所以它可以完全�?7 �?ASCII 来表�C�。像法语、西班牙语和徯��之类的西�Ƨ语�a�都��用叫�?ISO-8859-1 的编码系�l?(也叫�?#8220;latin-1”)�Q�它使用 7 �?ASCII 字符表示�?0 �?127 的数字，但接着扩展��C�� 128-255 的范围来表示�?n 上带有一个�L��线(241)�Q�和 u 上带有两个点(252)的字�W�。Unicode �?0 �?127 上��用了�?7 �?ASCII 码一��L��字符表，�?128 �?255上同 ISO-8859-1 一��P��接着使用剩余的数字，256 �?65535�Q�扩展到表示其它语言的字�W��?/p>
�?处理 unicode 数据�Ӟ��在某些地方你可能需要将数据转换回这些遗留编码系�l�之一。例如，��Z��同其它一些计��机�pȝ��集成�Q�这些系�l�期望它的数据��用一�U�特定的单字节编码模式，或将数据打印输出��C��个不识别 unicode 的终端或打印机。或��数据保存到一个明��指定编码模式的 XML 文档中�?/p>
在了解这个注解之后，让我们回�?Python上来�?/p>
�?2.0 版开始，Python 整个语言都已�l�支�?unicode�?span class=acronym>XML 包��?unicode 来保存所有解析了�?XML 数据�Q�而且你可以在��M��地方使用 unicode�?/p>

�?9.13. unicode 介绍

>>> s = u'Dive in'
>>> s
u'Dive in'
>>> print s
Dive in

��Z��创徏一�?unicode 字符串而不是通常�?ASCII 字符�Ԍ��要在字符串前面加上字�?“u”。注意这个特�D�的字符串没有�Q何非 ASCII 的字�W�。这样很好；unicode �?ASCII 的一个超�?(一个非常大的超�?�Q�所以�Q何正常的 ASCII 都可以以 unicode 形式保存��h��?/td>

在打印字�W�串�Ӟ��Python 试图��字�W�串转换��Z��的默认编码，通常�?ASCII �?�q�会儿有更详�l�的说明�? 因�ؓ�l�成�q�个 unicode 字符串的字符都是 ASCII 字符�Q�打印结果与打印正常�?ASCII 字符串是一��L��Q��{换是无缝的，而且如果你没有注意到 s 是一�?unicode 字符串的话，你永�q�也不会注意��C��者之间的差别�?/td>

�?9.14. 存储�?ASCII 字符

>>> s = u'La Pe\xf1a'
>>> print s
Traceback (innermost last):
File "", line 1, in ?
UnicodeError: ASCII encoding error: ordinal not in range(128)
>>> print s.encode('latin-1')
La Peña

unicode 真正的优势，理所当然的是它保存非 ASCII 字符的能力，例如西班牙语�?“ñ”(n 上带有一个�L��线)。用来表�C��L��线 n �?unicode 字符�~�码是十六进制的 0xf1 (十进制的241)�Q�你可以像这栯��入：\xf1�?/td>

�q�记得我说过 print 函数会尝试将 unicode 字符串�{换�ؓ ASCII 从而打印它吗？嗯，在这里将不会起作用，因�ؓ你的 unicode 字符串包含非 ASCII 字符�Q�所�?Python 会引�?UnicodeError 异常�?/td>

�q�儿��是��?unicode 转换为其它编码模式�v作用的地斏V�?tt class=varname>s 是一�?unicode 字符�Ԍ��?print 只能打印正常的字�W�串。�ؓ了解册��个问题，我们调用 encode �Ҏ�� (它可以用于每�?unicode 字符�? ��?unicode 字符串�{换�ؓ指定�~�码模式的正常字�W�串。我们向此函��C��入一个参数。在本例中，我们使用 latin-1 (也叫 iso-8859-1)�Q�它包括带�L��线�?n (然而缺省的 ASCII �~�码模式不包括，因�ؓ它只包含数��g�� 0 �?127 的字�W?�?/td>

�q�记得我说过�Q�需要从一�?unicode 得到一个正常字�W�串�Ӟ��Python 通常默认��?unicode 转换�?ASCII 吗？嗯，�q�个默认�~�码模式是一个可以定制的选项�?/p>

�?9.15. sitecustomize.py

# sitecustomize.py
# this file can be anywhere in your Python path,
# but it usually goes in ${pythondir}/lib/site-packages/
import sys
sys.setdefaultencoding('iso-8859-1')

sitecustomize.py 是一个特�D�的脚本�Q?span class=application>Python 会在启动的时候导入它�Q�所以在其中的�Q何代码都��自动运行。就像注解中提到的那��P��它可以放在�Q何地�?(只要 import 能够扑ֈ��?�Q�但是通常它位�?Python �?tt class=filename>lib 目录�?site-packages 目录中�?/td>

嗯，setdefaultencoding 函数讄��默认�~�码�?span class=application>Python 会在��M��需要将 unicode 字符串自动�{换�ؓ正规字符串的地方�Q��用这个编码模式�?/td>

�?9.16. 讄��默认�~�码的效�?/h3>
>>> import sys
>>> sys.getdefaultencoding()
'iso-8859-1'
>>> s = u'La Pe\xf1a'
>>> print s
La Peña

�q�个例子假设你已�l�按前一个例子中的改动对 sitecustomize.py 文�g做了修改�Q��ƈ且已�l�重启了 Python。如果你的默认编码还�?'ascii'�Q�可能你��没有正��设�|?sitecustomize.py 文�g�Q�或者是没有重新启动 Python。默认的�~�码只能�?Python 启动的时候改变；之后��׃��能改变了�?�׃��一些我们现在不会仔�l�研�I�的古怪的�~�程技巧，你甚至不能在 Python 启动之后调用 sys.setdefaultencoding 函数。仔�l�研�I?site.py�Q��ƈ搜烦 “setdefaultencoding” ��d��Cؓ什么吧�?

现在默认的编码模式已�l�包含了你在字符串中使用的所有字�W�，Python 对字�W�串的自动强制�{换和打印��׃��存在问题了�?/td>

�?9.17. 指定.py文�g的编�?/h3>
如果你打��在你的 Python 代码中保存非 ASCII 字符�Ԍ��你需要在每个文�g的顶端加入编码声明来指定每个 .py 文�g的编码。这个声明定义了 .py 文�g的编码�ؓ UTF-8�Q?/p>
#!/usr/bin/env python
# -*- coding: UTF-8 -*-

现在�Q�想�?XML 中的�~�码应该是怎样的呢�Q�不错，每一�?XML 文档都有指定的编码。重复一下，ISO-8859-1 是西�Ƨ语�a�存放数据的流行编码方式。KOI8-R 是俄语流行的�~�码方式。编码――如果指定了的话――都�?XML 文档的首部�?/p>

�?9.18. russiansample.xml

Пре��ис�xо�{ие

�q�是从一个真实的俄语 XML 文档中提取出来的�C�Z��Q�它��是�q�本书俄语翻译版的一部分。注意，�~�码 koi8-r 是在首部指定的�?/td>

�q�些是古代斯拉夫语的字符�Q�就我所知，它们用来拼写俄语单词“Preface”。如果你在一个正常文本编辑器中打开�q�个文�g�Q�这些字�W�非常像��q��Q�因为它们��用了 koi8-r �~�码模式�q�行�~�码�Q�但是却�?iso-8859-1 �~�码模式�q�行昄��?/td>

�?9.19. 解析 russiansample.xml

>>> from xml.dom import minidom
>>> xmldoc = minidom.parse('russiansample.xml')
>>> title = xmldoc.getElementsByTagName('title')[0].firstChild.data
>>> title
u'\u041f\u0440\u0435\u0434\u0438\u0441\u043b\u043e\u0432\u0438\u0435'
>>> print title
Traceback (innermost last):
File "", line 1, in ?
UnicodeError: ASCII encoding error: ordinal not in range(128)
>>> convertedtitle = title.encode('koi8-r')
>>> convertedtitle
'\xf0\xd2\xc5\xc4\xc9\xd3\xcc\xcf\xd7\xc9\xc5'
>>> print convertedtitle
Пре��ис�xо�{ие

我假讑֜��q�里你将前一个例子以 russiansample.xml 为名保存在当前目录中。也��Z��完整性的考虑�Q�我假设你已�l�删除了 sitecustomize.py 文�g�Q�将�~�省�~�码改回�?'ascii'�Q�或臛_��?setdefaultencoding 一行注释�v来了�?/td>

注意 title 标记 (现在�?title 变量中，上面那一长串 Python 函数我们暂且跌��Q�下一节再解释)――在 XML 文档�?title 元素中的文本数据是以 unicode 保存的�?/td>

直接打印 title 是不可能的，因�ؓ�q�个 unicode 字符串包含了�?ASCII 字符�Q�所�?Python 不能把它转换�?ASCII�Q�因为它无法理解�?/td>

但是�Q�你能够昑ּ�地将它�{换�ؓ koi8-r�Q�在本例中，我们得到一�?(正常�Q�非 unicode) 单字节字�W�的字符�?(f0, d2, c5�Q�等�{?�Q�它是初始unicode字符串中字符 koi8-r �~�码的版本�?/td>

打印 koi8-r �~�码的字�W�串有可能会在你的屏�q�上昄��Zؕ码，因�ؓ你的 Python IDE ��这些字�W�作�?iso-8859-1 的编码进行解析，而不�?koi8-r �~�码。但是，臛_��它们能打印�?(�q�且�Q�如果你仔细看，当在一个不支持 unicode 的文本编辑器中打开最初的 XML 文档�Ӟ��会看到相同的��q��?span class=application>Python 在解�?XML 文档�Ӟ��它�?koi8-r 转换��C��unicode�Q�你只不�q�是��它转换回来�?

�ȝ��一下，如果你以前从没有看到�q?unicode�Q�倒是有些唬�h�Q�但是在 Python 处理 unicode 数据真是非常�Ҏ��。如果你�?XML 文档都是 7 位的 ASCII (像本章中的例�?�Q�你差不多永�q�都不用考虑 unicode�?span class=application>Python 在进行解析时会将 XML 文档中的 ASCII 数据转换�?unicode�Q�在��M��需要的时候强制�{换回�?ASCII�Q�你甚至永远都不用注意。但是如果你要处理其它语�a�的数据，Python 已经准备好了�?/p>

Hero 2009-07-24 14:30 发表评论

Python中文�~�码问题

Hero — Fri, 24 Jul 2009 06:27:00 GMT

Python中有两种字符�Ԍ��分别是一般的字符�Ԍ��每个字符�? bits表示�Q�和Unicode字符�Ԍ��每个字符用一个或者多个字节表�C�）�Q�它们可以相互�{换。关于Unicode�Q�Joel Spolsky �?The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) 中有生动的说明，Jason Orendorff �?Unicode for programmers 有着更�ؓ全面的描�q�ͼ�在此我就不再多说什么了。来看下面的代码�Q?/p>
x = u"中文你好"
print s

    �q�行上述代码�Q�Python会给��Z��面的错误提示

SyntaxError: Non-ASCII character '\xd6' in file G:\workspace\chinese_problem\src\test.py on line 1, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

   说是遇到非ASCII字符了，�q�让我们参考pep-0263。PEP-0263�Q�Python Enhancement Proposal�Q�上面说得很清楚了，Python也意识到了国际化问题�Q��ƈ提出了解��x��案。根据提案上面的要求�Q�我们有如下代码

# -*- coding:gb2312 -*- �Q�必��d��W�一行或者第二行
print "-------------code 1----------------"
a = "中文a我爱�?
print a
print a.find("�?)
b = a.replace("�?, "喜欢")
print b
print "--------------code 2----------------"
x = "中文a我爱�?
y = unicode(x, "gb2312")
print y.encode("gb2312")
print y.find(u"�?)
z = y.replace(u"�?, u"喜欢")
print z.encode("gb2312")
print "---------------code 3----------------"
print y

    �E�序�q�行的结果如下：

-------------code 1----------------
中文a我爱�?br>5
中文a我喜�Ƣ你
--------------code 2----------------
中文a我爱�?br>3
中文a我喜�Ƣ你
---------------code 3----------------
Traceback (most recent call last):
File "G:\Downloads\eclipse\workspace\p\src\hello.py", line 16, in
    print y
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

     我们可以看到�Q�通过引入�~�码声明�Q�我们可以正常地在��用中文了�Q�而且在code 1�?中，控制��C��能正��的把中文打印出来。但是，很明显，上面的代码也反映��Z��不少的问题：
    1、code 1 �?2在��用print旉��用了不同的方式，1是直接print�Q��?在print之前先进行编�?br>    2、code 1 �?2中在同样的字�W�串查找同一个字�W?#8220;�?#8221;�Q�得出的�l�果不一��P��分别�?�?�Q?br>    3、code 3 中直接打印unicode字符�?y时出现错误（�q�也是�ؓ什么code 2中要先进行编码的原因�Q?/p>
    ��Z��么？��Z��么？我们可以先在脑�v中模拟一下我们��用Python的流�E�：首先�Q�我们先用编辑器�~�写好源代码�Q�保存成文�g。如果源代码中有�~�码声明而且用的�~�辑器支持该语法�Q�那么该文�g��׃��相应的编码方式保存在��盘中�?strong>注意�Q?/strong>�~�码声明和源文�g的编码不一定是一致的�Q�你完全可以在编码声明中声明�~�码为UTF-8�Q�但是用GB2312来保存源文�g。当�Ӟ��我们不可能自�ȝ��|��故意写错�Q�而且好的IDE也能强制保证两者的一致性，但是�Q�如果我们用��C��本或者EditPlus�{�编辑器来编写代码的话，一不小心就会出现这�U�问题的�?br>    得到一�?py文�g后，我们��可以运行它了，�q�是�Q�我们就把代码交�l�Python解析器来完成解析工作。解析器��d��文�g�Ӟ��先解析文件中的编码声明，我们假设文�g的编码�ؓgb2312�Q�那么先��文件中的内容由gb2312转换成Unicode�Q�然后再把这些Unicode转换为UTF-8格式的字节串。完成这一步骤后，解析器把�q�些UTF-8字节串分�D�，解析。如果遇��C��用Unicode字符�Ԍ��那么��׃��用相应的UTF-8字节串创建Unicode字符�Ԍ��如果�E�序中��用的是一般的字符�Ԍ��那么解析器先��UTF-8字节串通过Unicode转换成相应编码（�q�里��是gb2312�~�码�Q�的字节�Ԍ��q�用其创��Z��般的字符串对象。也��是��_��Unicode字符串跟一般字�W�串在内存中的存放格式是不一��L��Q�前者��用UTF-8的格式，后者��用GB2312格式�?br>    好了�Q�内存中的字�W�串存放格式我们知道了，下面我们要了解print的工作方式。print其实只是负责把内存中相应的字节串交给操作�pȝ��Q�让操作�pȝ��相应的程序（譬如cmd�H�口�Q�进行显�C�。这里有两种情况�Q?br>   1、若字符串是一般的字符�Ԍ��那么print只需把内存中相应的字节串推送给操作�pȝ��。如例子中的code 1�?br>    2、如果字�W�串是Unicode字符�Ԍ��那么print在推送之前先�q�行相应的encode�Q�我们可以显�C�Z��用Unicode的encode�Ҏ��使用合适的�~�码方式来编码（例子中code 2�Q�，否则Python使用默认的编码方式进行编码，也就是ASCII�Q�例子中的code 3�Q�。当然ASCII是不可能正确�~�码中文的，因此Python报错�?br>    ��x��Q�上面的三个问题我们已经可以解析�W�一和第三个了。至于第二个问题�Q�因为Python中有两种字符�Ԍ��一般字�W�串和Unicode字符�Ԍ��两者都有各自的字符处理�Ҏ��。对于前者，�Ҏ��是以字节的方式进行的�Q�而且在GB2312中，每个汉字占用两个字节�Q�因此得到的�l�果�?�Q�对于后者，也就是Unicode字符�Ԍ��所有字�W�都是统一看待的，因此得到3�?br>     虽然上面只提��C��控制台程序的中文问题�Q�但是文件读写以及网�l�传输中出现的中文问题在原理上都是类似的。Unicode的出现可以很大程度上解决软�g的国际化问题�Q�同时Python为Unicode提供了极��好的支持�Q�因此，我徏议大家在�~�写Python的程序时�Q�都�l�一使用Unicode方式。保存文件时使用UTF-8的编码方式。How to Use UTF-8 with Python有详�l�的描述�?br>

Hero 2009-07-24 14:27 发表评论

Hero — Wed, 20 Aug 2008 13:31:00 GMT

1 一个著名的定理是这��L��Q�最长上升序列的长度�{�于不上升序列的最��分划（卛_��q�面上的点分划成��可能少的不�怺�的不上升序列�Q�。下面我们就来给��个定理的证明�Q�在证明的过�E�中�Q�我们甚臛_��以得到求具体分割�Ҏ��的方法�?br> 2 证明�Q?br> 3 一个显然的�l�论是最长上升序列的长度��于�{�于不上升序列的最��分划。因��Z��升序列中��L��两点都不可能属于同一个不上升序列。也��是��_��最长上升序列中的所有点分属不同的不上升序列。所以，不上升序列的分划数最��也不会��于最长上升序列的长度�?br> 4 关键的是要证明，最长上升序列的长度大于�{�于不上升序列的最��分划。我们来构造一个不上升序列的分划�?br> 5 首先在二�l�Euclid�I�间中取出所有的满��如下性质的点(x, y)�Q�对于�Q意的�?x'', y'')�Q��L��x''≤x || y''≤y�Q�即(x�Q�y)�?#8220;右上�?#8221;没有别的炏V��可以证明，取出的点集{(x�Q�y)}是一条不上升序列。因为点集中��L��两点(x1, y1)�?x2, y2)��L��x1≤x2 || y1≤y2且x2≤x1 || y2≤y1�Q�整理一下即�?x1≤x2)xor(y1≤y2)�Q?/span>true。所以，把这些点按x升序排列后，得到的y相应的成降序�?br> 6 ��上面取出的点从�I�间中去除后�Q�重复上�q�过�E�，又可以得��C��条新的不上升序列。如此反�?#8230;…可以得到一个不上升序列的分�?现在�q�不能肯定这��是最��的分划)。由前面的结论知道，�q�个分划数必定大于等于最长上升序列的长度�?br> 7 我们对得到的不上升序列分划进行分�U�，先取出的�{��最高，最后取出的�{��最低。这样就得到k条分属level1�Q�level2�Q?#8230;�Q�levelk的不上升序列�?br> 8 �q�些链上的点满��q�样的性质�Q�对于一个属于leveli(i<k)链上的点(x, y)�Q�必然存在一个属于leveli+1的点(x'', y'')�Q��得x<x'' && y<y''。否�?x, y)在取leveli+l链时��׃��被取赎ͼ�不应属于leveli�?br> 9 从level1上的一点（x1, y1�Q�开始，取level2的点�Q�x2, y2�Q�，x2>x1 && y2>y1�Q�然后取level3的点�Q�x3, y3�Q?#8230;…最后必然能取到levelk上的点（xk, yk�Q�。如此得到的序列�Q�x1, y1�Q�，�Q�x2, y2�Q�，…�Q�（xk, yk�Q�，��是一条上升序列。所以，我们前面得到的不上升序列的分划数��׃��可能大于最长上升序列长度�?br>10 �q�就证明了最长上升序列的长度大于�{�于不上升序列的最��分划。再加上“最长上升序列的长度��于�{�于不上升序列的最��分�?#8221;的结论，��p��明了最长上升序列的长度�{�于不上升序列的最��分划�?br>11 �q�个证明的优点在于，它是一个构造性的证明�Q��ƈ且揭�C�Z��最长上升序列与不上升序列最��分划之间的较�ؓ深刻的关�p�R�?br>12 �Ҏ��前面的证明，我们可以很容易得��C��U�解��x��题的�Ҏ��Q?br>13 �Q?/span>1�Q�在�l�出的二元组中求出最长下降序列的长度�Q�具体实现比较简单，�q�里��׃��略了�Q�；
14 �Q?/span>2�Q�用�c�M��Topologic排序的方法，构造性的求出不下降序列的最��分�?详细�q�程见证�?�?br>15 �q�两�U�方法的旉��复杂度都是O(n2)的。实际上�Q�本题还能优化到O(nlog2n)�U�，考虑到题目的规模以及本文的侧重点�Q�这里就不详�l�展开了。此外，前面讲的�Ҏ��Q?/span>2�Q�，也是求最长双��N��题的一个基��?/span>

Hero 2008-08-20 21:31 发表评论

Hero — Sat, 09 Aug 2008 11:23:00 GMT

sprintf详解
转摘声明�Q�选自《CSDN �C�֌�电子杂志——C/C++杂志�?br>

在将各种�c�d��的数据构造成字符串时�Q�sprintf 的强大功能很��会让你失望。由于sprintf 跟printf 在用法上几乎一��P��只是打印的目的地不同而已�Q�前者打印到字符串中�Q�后者则直接在命令行上输出。这也导致sprintf 比printf 有用得多�?br>
sprintf 是个变参函数�Q�定义如下：
int sprintf( char *buffer, const char *format [, argument]  );
除了前两个参数类型固定外�Q�后面可以接��L��多个参数。而它的精华，昄��在�W�二个参敎ͼ�
格式化字�W�串上�?br>

printf 和sprintf 都��用格式化字符串来指定串的格式�Q�在格式串内部��用一些以“%”开头的格式说明�W�（format specifications�Q�来占据一个位�|�，在后边的变参列表中提供相应的变量�Q�最�l�函数就会用相应位置的变量来替代那个说明�W�，产生一个调用者想要的字符丌Ӏ?br>

格式化数字字�W�串
sprintf 最常见的应用之一莫过于把整数打印到字�W�串中，所以，spritnf 在大多数场合可以替代
itoa�?br>
如：
//把整�?23 打印成一个字�W�串保存在s 中�?/span>
sprintf(s, "%d", 123); //产生"123"
可以指定宽度�Q�不��的左边补空��|��
sprintf(s, "%8d%8d", 123, 4567); //产生�Q? 123 4567"
当然也可以左寚w��Q?br>sprintf(s, "%-8d%8d", 123, 4567); //产生�Q?123 4567"
也可以按�?6 �q�制打印�Q?br>sprintf(s, "%8x", 4567); //��写16 �q�制�Q�宽度占8 个位�|�，叛_��?/span>
sprintf(s, "%-8X", 4568); //大写16 �q�制�Q�宽度占8 个位�|�，左对�?/span>

�q�样�Q�一个整数的16 �q�制字符串就很容易得刎ͼ�但我们在打印16 �q�制内容�Ӟ��通常惌��一�U�左边补0 的等宽格式，那该怎么做呢�Q�很��单，在表�C�宽度的数字前面加个0 ��可以了�?br>sprintf(s, "%08X", 4567); //产生�Q?000011D7"
上面�?#8221;%d”�q�行�?0 �q�制打印同样也可以��用这�U�左边补0 的方式�?br>

�q�里要注意一个符��h��展的问题�Q�比如，假如我们��x��印短整数�Q?/span>short�Q?/span>-1 的内�?6 �q�制表示形式�Q�在Win32 �q�_��上，一个short 型占2 个字节，所以我们自然希望用4 �?6 �q�制数字来打印它�Q?br>short si = -1;
sprintf(s, "%04X", si);
产生“FFFFFFFF”�Q�怎么回事�Q�因为spritnf 是个变参函数�Q�除了前面两个参��C��外，后面的参数都不是�c�d��安全的，函数更没有办法仅仅通过一�?#8220;%X”��p��得知当初函数调用前参数压栈时被压�q�来的到底是�? 字节的整数还是个2 字节的短整数�Q�所以采取了�l�一4 字节的处理方式，��D��参数压栈时做了符��h��展，扩展成了32 位的整数-1�Q�打印时4 个位�|�不够了�Q�就�?2 位整�?/span>-1 �? �?6 �q�制都打印出来了�?br>
如果你想看si 的本来面目，那么��应该让�~�译器做0 扩展而不是符��h��展（扩展时二�q�制左边�? 而不是补�W�号位）�Q?br>sprintf(s, "%04X", (unsigned short)si);
��可以了。或者：
unsigned short si = -1;
sprintf(s, "%04X", si);

sprintf 和printf �q�可以按8 �q�制打印整数字符�Ԍ��使用”%o”。注�? �q�制�?6 �q�制都不会打
印出负数�Q�都是无�W�号的，实际上也��是变量的内部编码的直接�?6 �q�制�? �q�制表示�?br>

控制��点数打印格�?br>��点数的打印和格式控制是sprintf 的又一大常用功能，��点��C��用格式符”%f”控制�Q�默认保
留小数点�? 位数字，比如�Q?br>sprintf(s, "%f", 3.1415926); //产生"3.141593"
但有时我们希望自己控制打印的宽度和小��C��敎ͼ��q�时��应该��用：”%m.nf”格式�Q�其中m �?br>�C�打印的宽度�Q�n 表示��数点后的位数。比如：
sprintf(s, "%10.3f", 3.1415626); //产生�Q? 3.142"
sprintf(s, "%-10.3f", 3.1415626); //产生�Q?3.142 "
sprintf(s, "%.3f", 3.1415626); //不指定��d��度，产生�Q?3.142"

注意一个问题，你猜
int i = 100;
sprintf(s, "%.2f", i);
会打��Z��么东东来�Q?#8220;100.00”�Q�对吗？自己试试��q��道了�Q�同时也试试下面�q�个�Q?br>sprintf(s, "%.2f", (double)i);
�W�一个打出来的肯定不是正��结果，原因跟前面提到的一��P��参数压栈时调用者�ƈ不知道跟i相对应的格式控制�W�是�?#8221;%f”。而函数执行时函数本��n则�ƈ不知道当�q�被压入栈里的是个整敎ͼ�于是可怜的保存整数i 的那4 个字节就被不由分说地��作�ؓ��点数格式来解释了，整个乱套了。不�q�，如果有�h有兴��用手工编码一个��Q�Ҏ��Q�那么倒可以��用这�U�方法来��验一下你手工�~�排的结果是否正��?br>

字符/Ascii 码对�?br>我们知道�Q�在C/C++语言中，char 也是一�U�普通的scalable �c�d��Q�除了字长之外，它与short�Q?br>int�Q?/span>long �q�些�c�d��没有本质区别�Q�只不过被大家习惯用来表�C�字�W�和字符串而已。（或许当年该把
�q�个�c�d��叫做“byte”�Q�然后现在就可以�Ҏ��实际情况�Q��用byte 或short 来把char 通过typedef 定义出来�Q�这��h��合适些�Q�于是，使用”%d”或�?#8221;%x”打印一个字�W�，便能得出它的10 �q�制�?6 �q�制的ASCII 码；反过来，使用”%c”打印一个整敎ͼ�便可以看到它所对应的ASCII 字符。以下程序段把所有可见字�W�的ASCII 码对照表打印到屏�q�上�Q�这里采用printf�Q�注�?#8221;#”�?#8221;%X”合用时自动�ؓ16 �q�制数增�?#8221;0X”前缀�Q�：
for(int i = 32; i < 127; i++) {
printf("[ %c ]: %3d 0x%#04X\n", i, i, i);
}

�q�接字符�?br>sprintf 的格式控制串中既然可以插入各�U�东西，�q�最�l�把它们“�q�成一�?#8221;�Q�自然也��p��够连
接字�W�串�Q�从而在许多场合可以替代strcat�Q�但sprintf 能够一�ơ连接多个字�W�串�Q�自然也可以同时
在它们中间插入别的内容，��M��非常灉|��Q�。比如：
char* who = "I";
char* whom = "CSDN";
sprintf(s, "%s love %s.", who, whom); //产生�Q?I love CSDN. "
strcat 只能�q�接字符�Ԍ��一�D�以’’�l�尾的字�W�数�l�或叫做字符�~�冲�Q?/span>null-terminated-string�Q�，但有时我们有两段字符�~�冲区，他们�q�不是以 ’’�l�尾。比如许多从�W�三方库函数中返回的字符数组�Q�从��g或者网�l�传输中读进来的字符��，它们未必每一�D�字�W�序列后面都有个相应�?#8217;’来结��。如果直接连接，不管是sprintf �q�是strcat 肯定会导致非法内存操作，而strncat 也至��要求第一个参数是个null-terminated-string�Q�那该怎么办呢�Q�我们自然会惌��v前面介绍打印整数和��Q�Ҏ��时可以指定宽度，字符串也一��L��。比如：
char a1[] = {'A', 'B', 'C', 'D', 'E', 'F', 'G'};
char a2[] = {'H', 'I', 'J', 'K', 'L', 'M', 'N'};
如果�Q?br>sprintf(s, "%s%s", a1, a2); //Don't do that!
十有八九要出问题了。是否可以改成：
sprintf(s, "%7s%7s", a1, a2);
也没好到哪儿去，正确的应该是�Q?br>sprintf(s, "%.7s%.7s", a1, a2);//产生�Q?ABCDEFGHIJKLMN"
�q�可以类比打印��Q�Ҏ��?#8221;%m.nf”�Q�在”%m.ns”中，m 表示占用宽度�Q�字�W�串长度不��时补�I�格�Q�超��Z��则按照实际宽度打华ͼ��Q�n 才表�C�Z��相应的字�W�串中最多取用的字符数。通常在打印字�W�串时m 没什么大用，�q�是点号后面的n 用的多。自�Ӟ��也可以前后都只取部分字符�Q?br>sprintf(s, "%.6s%.5s", a1, a2);//产生�Q?ABCDEFHIJKL"
在许多时候，我们或许�q�希望这些格式控制符中用以指定长度信息的数字是动态的�Q�而不是静态指定的�Q�因��多时候，�E�序要到�q�行时才会清楚到底需要取字符数组中的几个字符�Q�这�U�动态的宽度/�_�ֺ�讄��功能在sprintf 的实��C��也被考虑��C��Q�sprintf 采用”*”来占用一个本来需要一个指定宽度或�_�ֺ�的常数数字的位置�Q�同��P��而实际的宽度或精度就可以和其它被打印的变量一栯��提供出来�Q�于是，上面的例子可以变成：
sprintf(s, "%.*s%.*s", 7, a1, 7, a2);
或者：
sprintf(s, "%.*s%.*s", sizeof(a1), a1, sizeof(a2), a2);
实际上，前面介绍的打印字�W�、整数、��Q�Ҏ��{�都可以动态指定那些常量��|��比如�Q?br>sprintf(s, "%-*d", 4, 'A'); //产生"65 "
sprintf(s, "%#0*X", 8, 128); //产生"0X000080"�Q?#"产生0X
sprintf(s, "%*.*f", 10, 2, 3.1415926); //产生" 3.14"

打印地址信息
有时调试�E�序�Ӟ��我们可能��x��看某些变量或者成员的地址�Q�由于地址或者指针也不过是个32 位的敎ͼ�你完全可以��用打印无�W�号整数�?#8221;%u”把他们打印出来：
sprintf(s, "%u", &i);
不过通常��Z��q�是喜欢使用16 �q�制而不�?0 �q�制来显�C�Z��个地址�Q?br>sprintf(s, "%08X", &i);
然而，�q�些都是间接的方法，对于地址打印�Q�sprintf 提供了专门的”%p”�Q?br>sprintf(s, "%p", &i);
我觉得它实际上就相当于：
sprintf(s, "%0*x", 2 * sizeof(void *), &i);
利用sprintf 的返回�?br>较少有�h注意printf/sprintf 函数的返回��|��但有时它却是有用的，spritnf �q�回了本�ơ函数调�?br>最�l�打印到字符�~�冲��Z��的字�W�数目。也��是说每当一�ơsprinf 调用�l�束以后�Q�你无须再调用一��?br>strlen 便已�l�知道了�l�果字符串的长度。如�Q?br>int len = sprintf(s, "%d", i);
对于正整数来��_��len 便等于整数i �?0 �q�制位数�?br>下面的是个完整的例子�Q��?0 个[0, 100)之间的随机数�Q��ƈ��他们打印到一个字�W�数�l�s 中，
以逗号分隔开�?br>#include
#include
#include
int main()
{
   srand(time(0));
   char s[64];
   int offset = 0;
   for(int i = 0; i < 10; i++) {
      offset += sprintf(s + offset, "%d,", rand() % 100);
   }
   s[offset - 1] = '\n';//��最后一个逗号换成换行�W��?/span>
   printf(s);
   return 0;
}
设想当你从数据库中取��Z��条记录，然后希望把他们的各个字段按照某种规则�q�接成一个字
�W�串�Ӟ��可以��用这�U�方法，从理��Z��Ԍ��他应该比不断的strcat 效率高，因�ؓstrcat 每次调用
都需要先扑ֈ�最后的那个’’的位�|�，而在上面�l�出的例子中�Q�我们每�ơ都利用sprintf �q�回值把�q?br>个位�|�直接记下来了�?br>

使用sprintf 的常见问�?br>sprintf 是个变参函数�Q��用时�l�常出问题，而且只要出问题通常��是能导致程序崩溃的内存�?br>问错误，但好在由sprintf 误用��D��的问题虽然严重，却很�Ҏ��扑և��Q�无非就是那么几�U�情况，�?br>常用眼睛再把出错的代码多看几眼就看出来了�?br>

?? �~�冲区溢�?br>�W�一个参数的长度太短了，没的��_��l�个大点的地方吧。当然也可能是后面的参数的问
题，��变参对应一定要�l�心�Q�而打印字�W�串�Ӟ��量使用”%.ns”的�Ş式指定最大字�W�数�?br>

?? 忘记了第一个参�?br>低��得不能再低��问题�Q�用printf 用得太惯了�?/span>//偶就常犯。：。（

?? 变参对应出问�?br>通常是忘��C��提供对应某个格式�W�的变参�Q�导致以后的参数�l�统错位�Q�检查检查吧。尤
其是对应”*”的那些参敎ͼ�都提供了吗？不要把一个整数对应一�?#8221;%s”�Q�编译器会觉得你
�ƺ她太甚了（�~�译器是obj 和exe 的妈妈，应该是个女的�Q?P�Q��?br>

strftime
sprnitf �q�有个不错的表妹�Q�strftime�Q�专门用于格式化旉��字符串的�Q�用法跟她表哥很像，�?br>是一大堆格式控制�W�，只是毕竟��姑娘家心细�Q�她�q�要调用者指定缓冲区的最大长度，可能是�ؓ
了在出现问题时可以推卸责��d��。这里�D个例子：
time_t t = time(0);
//产生"YYYY-MM-DD hh:mm:ss"格式的字�W�串�?/span>
char s[32];
strftime(s, sizeof(s), "%Y-%m-%d %H:%M:%S", localtime(&t));
sprintf 在MFC 中也能找��C��的知韻I��CString::Format�Q�strftime 在MFC 中自然也有她的同道：
CTime::Format�Q�这一对由于从面向对象哪里得到了赞助，用以写出的代码更觉优雅�?br>

Hero 2008-08-09 19:23 发表评论

国产午夜精品在线观看,欧美日本中文,欧美视频亚洲视频

�E�序员常用字�?vs2008字体修改�Ҏ��)

javascript [转蝲]

[转蝲] python中文�~�码问题

�?9.13. unicode 介绍

�?9.14. 存储�?ASCII 字符

�?9.15. `sitecustomize.py`

�?9.18. `russiansample.xml`

�?9.19. 解析 `russiansample.xml`

Python中文�~�码问题

国产午夜精品在线观看,欧美日本中文,欧美视频亚洲视频

�E�序员常用字�?vs2008字体修改�Ҏ��)

javascript [转蝲]

[转蝲] python中文�~�码问题

�?9.13. unicode 介绍

�?9.14. 存储�?ASCII 字符

�?9.15. sitecustomize.py

�?9.18. russiansample.xml

�?9.19. 解析 russiansample.xml

Python中文�~�码问题

�?9.15. `sitecustomize.py`

�?9.18. `russiansample.xml`

�?9.19. 解析 `russiansample.xml`