• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            陳碩的Blog

            C++ 工程實踐(3):采用有利于版本管理的代碼格式

            陳碩 (giantchen_AT_gmail)

            Blog.csdn.net/Solstice

            版本管理(version controlling)是每個程序員的基本技能,C++ 程序員也不例外。版本管理的基本功能之一是追蹤代碼變化,讓你能清楚地知道代碼是如何一步步變成現在的這個樣子,以及每次 check-in 都具體改動了哪些內部。無論是傳統的集中式版本管理工具,如 Subversion,還是新型的分布式管理工具,如 Git/Hg,比較兩個版本(revision)的差異都是其基本功能,即俗稱“做一下 diff”。

            diff 的輸出是個窺孔(peephole),它的上下文有限(diff –u 默認顯示前后 3 行)。在做 code review 的時候,如果能憑這“一孔之見”就能發現代碼改動有問題,那就再好也不過了。

             

            C 和 C++ 都是自由格式的語言,代碼中的換行符被當做 white space 來對待。(當然,我們說的是預處理(preprocess)之后的情況)。對編譯器來說一模一樣的代碼可以有多種寫法,比如

            foo(1, 2, 3, 4);

            foo(1,

                2,

                3,

                4);

            詞法分析的結果是一樣的,語意也完全一樣。

            對人來說,這兩種寫法讀起來不一樣,對與版本管理工具來說,同樣功能的修改造成的差異(diff)也往往不一樣。所謂“有利于版本管理”,就是指在代碼中合理使用換行符,對 diff 工具友好,讓 diff 的結果清晰明了地表達代碼的改動。(diff 一般以行為單位,也可以以單詞為單位,本文只考慮最常見的 diff by lines。)

            這里舉一些例子。

            對 diff 友好的代碼格式

            1. 多行注釋也用 //,不用 /* */

            Scott Meyers 寫的《Effective C++》第二版第 4 條建議使用 C++ 風格,我這里為他補充一條理由:對 diff 友好。比如,我要注釋一大段代碼(其實這不是個好的做法,但是在實踐中有時會遇到),如果用 /* */,那么得到的 diff 是:

            diff --git a/examples/asio/tutorial/timer5/timer.cc b/examples/asio/tutorial/timer5/timer.cc
            --- a/examples/asio/tutorial/timer5/timer.cc
            +++ b/examples/asio/tutorial/timer5/timer.cc
            @@ -18,6 +18,7 @@ class Printer : boost::noncopyable
            loop2_->runAfter(1, boost::bind(&Printer::print2, this));
            }
            +  /*
            ~Printer()
            {
            std::cout << "Final count is " << count_ << "\n";
            @@ -38,6 +39,7 @@ class Printer : boost::noncopyable
            loop1_->quit();
            }
            }
            +  */
            
            void print2()
            {
            

            從這樣的 diff output 能看出注釋了哪些代碼嗎?

            如果用 //,結果會清晰很多:

            diff --git a/examples/asio/tutorial/timer5/timer.cc b/examples/asio/tutorial/timer5/timer.cc
            --- a/examples/asio/tutorial/timer5/timer.cc
            +++ b/examples/asio/tutorial/timer5/timer.cc
            @@ -18,26 +18,26 @@ class Printer : boost::noncopyable
            loop2_->runAfter(1, boost::bind(&Printer::print2, this));
            }
            -  ~Printer()
            -  {
            -    std::cout << "Final count is " << count_ << "\n";
            -  }
            +  // ~Printer()
            +  // {
            +  //   std::cout << "Final count is " << count_ << "\n";
            +  // }
            -  void print1()
            -  {
            -    muduo::MutexLockGuard lock(mutex_);
            -    if (count_ < 10)
            -    {
            -      std::cout << "Timer 1: " << count_ << "\n";
            -      ++count_;
            -
            -      loop1_->runAfter(1, boost::bind(&Printer::print1, this));
            -    }
            -    else
            -    {
            -      loop1_->quit();
            -    }
            -  }
            +  // void print1()
            +  // {
            +  //   muduo::MutexLockGuard lock(mutex_);
            +  //   if (count_ < 10)
            +  //   {
            +  //     std::cout << "Timer 1: " << count_ << "\n";
            +  //     ++count_;
            +  //
            +  //     loop1_->runAfter(1, boost::bind(&Printer::print1, this));
            +  //   }
            +  //   else
            +  //   {
            +  //     loop1_->quit();
            +  //   }
            +  // }
            void print2()
            {
            

            同樣的道理,取消注釋的時候 // 也比 /* */ 更清晰。

            另外,如果用 /* */ 來做多行注釋,從 diff 不一定能看出來你是在修改代碼還是修改注釋。比如以下 diff 似乎修改了 muduo::EventLoop::runAfter 的調用參數:

            diff --git a/examples/asio/tutorial/timer5/timer.cc b/examples/asio/tutorial/timer5/timer.cc
            --- a/examples/asio/tutorial/timer5/timer.cc
            +++ b/examples/asio/tutorial/timer5/timer.cc
            @@ -32,7 +32,7 @@ class Printer : boost::noncopyable
            std::cout << "Timer 1: " << count_ << "\n";
            ++count_;
            -      loop1_->runAfter(1, boost::bind(&Printer::print1, this));
            +      loop1_->runAfter(2, boost::bind(&Printer::print1, this));
            }
            else
            {
            

            其實這個修改發生在注釋里邊 (要增加上下文才能看到, diff -U 20,多一道手續,降低了工作效率),對代碼行為沒有影響:

            diff --git a/examples/asio/tutorial/timer5/timer.cc b/examples/asio/tutorial/timer5/timer.cc
            --- a/examples/asio/tutorial/timer5/timer.cc
            +++ b/examples/asio/tutorial/timer5/timer.cc
            @@ -20,31 +20,31 @@ class Printer : boost::noncopyable
               /*
               ~Printer()
            {
            std::cout << "Final count is " << count_ << "\n";
            }
            void print1()
            {
            muduo::MutexLockGuard lock(mutex_);
            if (count_ < 10)
            {
            std::cout << "Timer 1: " << count_ << "\n";
            ++count_;
            -      loop1_->runAfter(1, boost::bind(&Printer::print1, this));
            +      loop1_->runAfter(2, boost::bind(&Printer::print1, this));
            }
            else
            {
            loop1_->quit();
            }
            }
               */
            
            void print2()
            {
            muduo::MutexLockGuard lock(mutex_);
            if (count_ < 10)
            {
            std::cout << "Timer 2: " << count_ << "\n";
            ++count_;
            

            總之,不要用 /* */ 來注釋多行代碼。

            或許是時過境遷,大家都在用 // 注釋了,《Effective C++》第三版去掉了這一條建議。

            2. 局部變量與成員變量的定義

            基本原則是,一行代碼只定義一個變量,比如

            double x;

            double y;

            將來代碼增加一個 double z 的時候,diff 輸出一眼就能看出改了什么:

            @@ -63,6 +63,7 @@ private:
            int count_;
            double x;
            double y;
            +  double z;
            };
            int main()
            

            如果把 x 和 y 寫在一行,diff 的輸出就得多看幾眼才知道。

            @@ -61,7 +61,7 @@ private:
            muduo::net::EventLoop* loop1_;
            muduo::net::EventLoop* loop2_;
            int count_;
            -  double x, y;
            +  double x, y, z;
             };
            int main()
            

            所以,一行只定義一個變量更利于版本管理。同樣的道理適用于 enum 成員的定義,數組的初始化列表等等。

            3. 函數聲明中的參數

            如果函數的參數大于 3 個,那么在逗號后面換行,這樣每個參數占一行,便于 diff。以 muduo::net::TcpClient 為例:

            class TcpClient : boost::noncopyable
            {
            public:
             TcpClient(EventLoop* loop,
            const InetAddress& serverAddr,
            const string& name);

            如果將來 TcpClient 的構造函數增加或修改一個參數,那么很容易從 diff 看出來。這恐怕比在一行長代碼里數逗號要高效一些。

            4. 函數調用時的參數

            在函數調用的時候,如果參數大于 3 個,那么把實參分行寫。以 muduo::net::EPollPoller 為例:

            Timestamp EPollPoller::poll(int timeoutMs, ChannelList* activeChannels)
            {
            int numEvents = ::epoll_wait(epollfd_,
            &*events_.begin(),
            static_cast<int>(events_.size()),
            timeoutMs);
            Timestamp now(Timestamp::now());
            

            這樣一來,如果將來重構引入了一個新參數(好吧,epoll_wait 不會有這個問題),那么函數定義和函數調用的地方的 diff 具有相同的形式(比方說都是在倒數第二行加了一行內容),很容易肉眼驗證有沒有錯位。如果參數寫在一行里邊,就得睜大眼睛數逗號了。

            5. class 初始化列表的寫法

            同樣的道理,class 初始化列表(initializer list)也遵循一行一個的原則,這樣將來如果加入新的成員變量,那么兩處(class 定義和 ctor 定義)的 diff 具有相同的形式,讓錯誤無所遁形。以 muduo::net::Buffer 為例:

            class Buffer : public muduo::copyable
            {
            public:
            static const size_t kCheapPrepend = 8;
            static const size_t kInitialSize = 1024;
            Buffer()
                : buffer_(kCheapPrepend + kInitialSize),
            readerIndex_(kCheapPrepend),
            writerIndex_(kCheapPrepend)
            {
            }
            // 省略
            
             private:
               std::vector<char> buffer_;
            size_t readerIndex_;
            size_t writerIndex_;
            static const char kCRLF[];
            };
            

            注意,初始化列表的順序必須和數據成員聲明的順序相同。

            6. 與 namespace 有關的縮進

            Google 的 C++ 編程規范明確指出,namespace 不增加縮進。這么做非常有道理,方便 diff –p 把函數名顯示在每個 diff chunk 的頭上。

            如果對函數實現做 diff,chunk name 是函數名,讓人一眼就能看出改的是哪個函數。如下圖,紅色劃線部分。

            diff_function

            如果對 class 做 diff,那么 chunk name 就是 class name。

            diff_class

            diff 原本是為 C 語言設計的,C 語言沒有 namespace 縮進一說,所以它默認會找到“頂格寫”的函數作為一個 diff chunk 的名字,如果函數名前面有空格,它就不認得了。muduo 的代碼都遵循這一規則,例如:

            namespace muduo
            {
            ///
            /// Time stamp in UTC, in microseconds resolution.
            ///
            /// This class is immutable.
            /// It's recommended to pass it by value, since it's passed in register on x64.
            ///
            class Timestamp : public muduo::copyable,
            public boost::less_than_comparable<Timestamp>
            {
            // class 從第一列開始寫,不縮進
            
            // 函數的實現也從第一列開始寫,不縮進。
            Timestamp Timestamp::now()
            {
            struct timeval tv;
            gettimeofday(&tv, NULL);
            int64_t seconds = tv.tv_sec;
            return Timestamp(seconds * kMicroSecondsPerSecond + tv.tv_usec);
            }

            相反,boost 中的某些庫的代碼是按 namespace 來縮進的,這樣的話看 diff 往往不知道改動的是哪個 class 的哪個成員函數。

            這個或許可以通過設置 diff 取函數名的正則表達式來解決,但是如果我們寫代碼的時候就注意把函數“頂格寫”,那么就不用去動 diff 的默認設置了。另外,正則表達式不能完全匹配函數名,因為函數名是上下文無關語法(context-free syntax),你沒辦法寫一個正則語法去匹配上下文無關語法。我總能寫出某種函數聲明,讓你的正則表達式失效(想想函數的返回類型,它可能是一個非常復雜的東西,更別說參數了)。更何況 C++ 的語法是上下文相關的,比如你猜 Foo<Bar> qux; 是個表達式還是變量定義?

            7. public 與 private

            我認為這是 C++ 語法的一個缺陷,如果我把一個成員函數從 public 區移到 private 區,那么從 diff 上看不出來我干了什么,例如:

            diff --git a/muduo/net/TcpClient.h b/muduo/net/TcpClient.h
            --- a/muduo/net/TcpClient.h
            +++ b/muduo/net/TcpClient.h
            @@ -37,7 +37,6 @@ class TcpClient : boost::noncopyable
            void connect();
            void disconnect();
            -  bool retry() const;
               void enableRetry() { retry_ = true; }
            /// Set connection callback.
            @@ -60,6 +59,7 @@ class TcpClient : boost::noncopyable
            void newConnection(int sockfd);
            /// Not thread safe, but in loop
            void removeConnection(const TcpConnectionPtr& conn);
            +  bool retry() const;
            EventLoop* loop_;
            boost::scoped_ptr<Connector> connector_; // avoid revealing Connector
            

            從上面的 diff 能看出我把 retry() 變成 private 了嗎?對此我也沒有好的解決辦法,總不能每個函數前面都寫上 public: 或 private: 吧?

            對此 Java 和 C# 都做得比較好,它們把 public/private 等修飾符放到每個成員函數的定義中。這么做增加了信息的冗余度,讓 diff 的結果更直觀。

             

            歡迎補充。

            對 grep 友好的代碼風格

            操作符重載

            C++工具匱乏,在一個項目里,要找到一個函數的定義或許不算太難(最多就是分析一下重載和模板特化),但是要找到一個函數的使用就難多了。不比 Java,在 Eclipse 里 Ctrl+Shift+G 就能找到所有的引用點。

            假如我要做一個重構,想先找到代碼里所有用到 muduo::timeDifference 的地方,判斷一下工作是否可行,基本上惟一的辦法是grep。用 grep 還不能排除同名的函數和注釋里的內容。這也說明為什么要用 // 來引導注釋,因為在 grep 的時候,一眼就能看出這行代碼是在注釋里的。

            在我看來,operator overloading 應僅限于和 STL algorithm/container 配合時使用,比如 transform() 和 map<T,U>,其他情況都用具名函數為宜。原因之一是,我根本用 grep 找不到在哪兒用到了 operator-()。這也是 muduo::Timestamp 只提供 operator<() 而不提供 operator+() operator-() 的原因,我提供了兩個函數 timeDifference 和 addTime 來實現所需的功能。

            又比如,Google Protocol Buffers 的回調是 class Closure,它的接口用的是 virtual function Run() 而不是 virtual operator()()。

            static_cast 與 C-style cast

            為什么 C++ 要引入 static_cast 之類的轉型操作符,原因之一就是像 (int*) pBuffer 這樣的表達式基本上沒辦法用 grep 判斷出它是個強制類型轉換,寫不出一個剛好只匹配類型轉換的正則表達式。(again,語法是上下文無關的,無法用正則搞定。)

            如果類型轉換都用 *_cast,那只要 grep 一下我就能知道代碼里哪兒用了 reinterpret_cast 轉換,便于迅速地檢查有沒有用錯。為了強調這一點,muduo 開啟了編譯選項 -Wold-style-cast 來幫助查找 C-style cast,這樣在編譯時就能幫我們找到問題。

             一切為了效率

            如果用圖形化的文件比較工具,似乎能避免上面列舉的問題。但無論是 web 還是客戶端,無論是 inline diff 還是 diff by lines 都不能解決全部問題,效率也不一定更高。

            對于(2),如果想知道是誰在什么時候增加的 double z,在分行寫的情況下,用 git blame 或 svn blame 立刻就能找到始作俑者。如果寫成一行,那就得把文件的 revisions 拿來一個個人工比較,因為這一行 double x = 0.0, y = 1.0, z = -1.0; 可能修改過多次,你得一個個看才知道什么時候加入了變量 z。這個 blame 的 case 也適用于 3、4、5。

            比如(6)改動了一行代碼,你還是要 scroll up 去找改的是哪個 function,人眼看的話還有“看走眼”的可能,又得再定睛觀瞧。這一切都是浪費人的時間,使用更好的圖形化工具并不能減少浪費,相反,我認為增加了浪費。

            另外一個常見的工作場景,早上來到辦公室,update 一下代碼,然后掃一眼 diff output 看看別人昨天動了哪些文件,改了哪些代碼,這就是一兩條命令的事,幾秒鐘就能解決戰斗。如果用圖形化的工具,得一個個點開文件 diff 的鏈接或點開新 tab 來看文件的 side-by-side 比較(不這么做的話看不到足夠多的上下文,跟看 diff output 無異),然后點擊鼠標滾動頁面去看別人到底改了什么。說實話我覺得這么做效率不比 diff 高。

            (待續)

            posted on 2011-03-05 15:16 陳碩 閱讀(3318) 評論(7)  編輯 收藏 引用

            評論

            # re: C++ 工程實踐(3):采用有利于版本管理的代碼格式 2011-03-05 21:43 陳梓瀚(vczh)

            工具不行,就換一個/自己做一個嘛。這樣才能進步。  回復  更多評論   

            # re: C++ 工程實踐(3):采用有利于版本管理的代碼格式 2011-03-06 18:38 classyk

            我建議多行還是用/* */來注釋,盡管現在很多的編輯器已經很方便的可以多行//注釋。

            因為 / * */框住的代碼,意味著是一個相關聯的段落
            而多行//則表示不了這種意思。

              回復  更多評論   

            # re: C++ 工程實踐(3):采用有利于版本管理的代碼格式 2011-03-06 19:52 陳碩

            @classyk
            這個好吧,用縮進。注釋函數的時候把 // 放第一列,注釋 for 循環的時候把 // 與 for 上面一行語句對齊。  回復  更多評論   

            # re: C++ 工程實踐(3):采用有利于版本管理的代碼格式 2011-03-10 17:01 violet

            聲明變量時分行寫,代碼很不好看啊。
            為了diff方便而降低了代碼可讀性,不太好吧  回復  更多評論   

            # re: C++ 工程實踐(3):采用有利于版本管理的代碼格式 2011-03-10 19:48 陳碩

            @violet
            你的意思是
            string name;
            string address;

            string name, address;
            要難看?  回復  更多評論   

            # re: C++ 工程實踐(3):采用有利于版本管理的代碼格式 2011-03-21 22:03 3tgame

            @@ -37,7 +37,6 @@ class TcpClient : boost::noncopyable
            -37,7 +37,6 表示啥意思?怎么跟默認的linux的diff輸出信息不一樣  回復  更多評論   

            # re: C++ 工程實踐(3):采用有利于版本管理的代碼格式 2011-03-22 08:20 陳碩

            diff -u
            http://en.wikipedia.org/wiki/Diff#Unified_format  回復  更多評論   

            <2011年2月>
            303112345
            6789101112
            13141516171819
            20212223242526
            272812345
            6789101112

            導航

            統計

            常用鏈接

            隨筆分類

            隨筆檔案

            相冊

            搜索

            最新評論

            閱讀排行榜

            評論排行榜

            一97日本道伊人久久综合影院| 久久中文字幕人妻丝袜| 一本一道久久精品综合| 色综合久久88色综合天天| 国产精品久久久久久久午夜片| 一本一道久久a久久精品综合| 亚洲精品无码久久久影院相关影片| 久久亚洲日韩精品一区二区三区 | 久久人人爽人人爽人人片AV东京热 | 久久久WWW成人免费精品| 亚洲熟妇无码另类久久久| 国产高清国内精品福利99久久| 久久影视国产亚洲| 久久er热视频在这里精品| 久久久久免费视频| 久久青青草原国产精品免费 | 久久综合给久久狠狠97色| 66精品综合久久久久久久| 无码人妻久久一区二区三区免费丨| 国产999精品久久久久久| 久久99精品久久久久婷婷| 国产精品久久久久久久久久影院| 99久久精品无码一区二区毛片 | 久久久久婷婷| 91精品国产综合久久四虎久久无码一级| 久久亚洲国产成人影院| 色播久久人人爽人人爽人人片aV | 久久99热这里只频精品6| 91久久精品视频| 久久精品视频免费| jizzjizz国产精品久久| 久久综合噜噜激激的五月天| 亚洲欧美一级久久精品| 亚洲国产成人久久一区久久| 久久99精品国产麻豆婷婷| 久久99精品久久久久久| 久久久精品免费国产四虎| 国产精品一久久香蕉国产线看 | 久久婷婷国产剧情内射白浆| 天堂无码久久综合东京热| 性做久久久久久久久|