2012年9月6日
上篇博文中說明了如何通過命令編譯及運行自己的Java文件。但是當前都是以項目為單位的,如何組織項目中的文件以及對項目的編譯運行,是命令行編譯主要解決的問題。
1. 項目組織 我們以下面的項目作為樣例來說明:
Test/
|-- Test.jar
|-- classes
| |-- Main.class
| |-- OutterTest.class
| `-- inner
| `-- InnerTest.class
|-- run.py
|-- run.sh
`-- src
|-- Main.java
|-- OutterTest.java
`-- inner
`-- InnerTest.java
上面是一個項目:Test。其中,有兩個文件夾,src用來放置所有的源代碼,也就是.java文件;classes用來放置相應的.class文件。Test.jar是最終生成的jar文件,run.py和run.sh是項目的腳本文件。下面列出三個.java文件,只是簡單的顯示一句話:
// Main.java
import inner.*;
public class Main
{
public static void main(String[] args)
{
System.out.println("main: hello word!");
OutterTest out1 = new OutterTest();
out1.hello();
InnerTest in1 = new InnerTest();
in1.hello();
}
}
// OutterTest.java
public class OutterTest
{
public void hello()
{
System.out.println("Hello OutterTest!");
}
}
// InnerTest.java
package inner;
public class InnerTest
{
public void hello()
{
System.out.println("Hello InnerTest!");
}
}
注意上面的InnerTest類,它在package inner中,所以將InnerTest.java放在inner文件夾下,這樣可以保證統一。在Eclipse中,新建一個類時,會讓你填寫package名,然后Eclipse會為你新新建一個相應的文件夾。
2. 項目編譯 javac -d classes src/*.java src/inner/*.java 由上一篇知道,javac中-d表示”指定存放生成的類文件的位置“,也就是將生成的.class文件放在-d指定的文件夾中。需要指出的是,classes文件夾是手動建立的。
另外,javac還可以批量編譯.java文件,上面的命令表示編譯src目錄下的所以.java文件、編譯src/inner目錄下的所有.java文件。這樣就可以批量編譯.java文件,并將生成的.class文件放在classes文件夾中。這里同樣要指出一點,因為package inner的關系,會自動建立inner文件夾,并將所有package inner下的類文件.class放在classes/inner下。
3.項目打包 jar -cvf Test.jar -C classes/ . 這個命令將會把classes下的所有文件(包括.class和文件夾等)打包為Test.jar文件。
上篇博客中,介紹了參數-C的意義:-C 更改為指定的目錄并包含其中的文件,如果有任何目錄文件, 則對其進行遞歸處理。它相當于使用 cd 命令轉指定目錄下。
注意后面的"."的用法,jar可以遞歸的打包文件夾,"."表示是當前文件夾。如果執行命令“jar -cvf Test.jar .”,表示將當前目錄下的所有文件及文件夾打包。所以上面的命令的意思就是“將classes下的所有文件打包為Test.jar”。
4.項目運行 java -cp Test.jar Main 通過上面的命令就可以執行Test.jar中的Main.class。其中,cp指定了jar文件的位置。
5. 腳本文件 通過上面的幾步,我們就可以完成整個項目的編譯和運行。而且,通過src和classes兩個文件夾將源文件和目標文件分開,使項目比較整潔。但是如果每次編譯、運行都要輸入上面一系列命令,還是比較繁瑣的,尤其當項目文件較多時,這時通過腳本文件管理整個項目是明智的選擇。
下面是項目的腳本文件run.py
import os
import sys
if __name__ == "__main__":
ProjectJar = "Test.jar"
if sys.argv[1] == "c":
print("Compile program.")
src = "src/*.java src/inner/*.java"
os.system("javac -d classes " + src)
os.system("jar -cvf " + ProjectJar + " -C classes/ .")
if sys.argv[1] == "r":
print("Run program.")
os.system("java -cp " + ProjectJar + " Main")
print("Over!")
通過這個腳本文件,可以使用"python run.py c"完成項目的編譯、打包;使用"python run.py r"運行項目。
通過這篇文章,我們已經了解了Java項目的管理方法,以及編譯、打包、運行的命令行,最后介紹了使用腳本文件有效管理項目。
附件中包含整個項目,同時還包括一個run.sh,方便不熟悉python的人查看。
附件:
Test.tar
2012年8月22日
當前大部分開發者在開發Java程序時使用Eclipse,它可以方便的進行程序的編譯、打包和運行。但是不使用IDE,在完全的命令行下進行Java開發者從未用過的。在命令行下進行開發不是用來在展現自己有多牛,而是通過命令行開發,可以對Java的編譯、jar包等各個部分有一個深入了解。
下面的幾篇博客將會對Java的編譯、打包和運行方法由淺入深的進行介紹。
在這里使用的操作系統是Linux,并提供相應的shell和python腳本。
首先介紹一下三個常用的命令:javac、jar、java。每個命令都有不同的參數,這些參數的用法會詳細介紹。
1. javac javac的功能是對java源代碼進行編譯,將后綴為.java的文件編譯為.class的文件。javac的一般格式是
javac <選項> <源文件>
例如:
javac Main.java
會產生Main.class文件。
javac的常用選項有:
-classpath <路徑> 指定查找用戶類文件的位置
-cp <路徑> 指定查找用戶類文件的位置(與上面的選項一樣,cp是classpath的簡寫)
-d <目錄> 指定存放生成的類文件的位置
2.jar jar的功能是根據選項將指定的一些.class文件打包為一個jar包。jar的一般格式是
jar {ctxui}[vfm0Me] [jar-文件] [manifest-文件] [-C 目錄] 文件名 ...
例如,
jar cvf Test.jar Main.class Bar.class
它將Main.class和Bar.class打包為一個文件Test.jar。
jar命令的選項比較多,用到選項包括:
-c 創建新的歸檔文件
-t 列出歸檔目錄
-x 從檔案中提取指定的 (或所有) 文件
-u 更新現有的歸檔文件
-v 在標準輸出中生成詳細輸出
-f 指定歸檔文件名
-m 包含指定清單文件中的清單信息
-e 為捆綁到可執行 jar 文件的獨立應用程序,指定應用程序入口點
-C 更改為指定的目錄并包含其中的文件,如果有任何目錄文件, 則對其進行遞歸處理。
例如,
上例中的cvf參數,分別表示創建新的jar文件、創建時顯示jar包的信息(可以執行看一下)、指定jar包名為Test.jar。
jar tf Test.jar 查看Test.jar的內容,其中t表示列出jar包內容,f指定jar包名
jar xf Test.jar 解壓Test.jar文件
jar xf Test.jar Main.class 僅解壓Test.jar中的Main.class文件
這里要指出的是,f/m/e都指定一個名稱(jar包名, 清單文件名和入口點名稱),相應的名稱順序與參數的順序要一致。
3.java java的功能是執行應用程序。java的一般格式是
執行一個類: java [ options ] class [ argument ... ]
執行一個jar包:java [ options ] -jar file.jar [ argument ... ]
例如:
java Main
執行Main.class,注意上面沒有.class后綴
java Test.jar
執行一個jar包,這個jar包中要指定了程序入口點(通過在MANIFEST.MF文件中指定)。
常用的java的選項:
-classpath<類搜索路徑> 指定用戶類文件的位置,可能為文件夾、zip、jar文件
總結
通過這篇內容,我們應用學會了如何使用javac編譯自己的類,并使用java執行自己的類。但是關于打包的操作及jar的執行比較復雜,將在以后繼續介紹。
2012年8月17日
Java中計算中文的MD5值
前幾天的工作中,需要計算中文的MD5值,計算的函數接口及調用方式如下:
public static String getMD5(byte[] source);
String s = "中文編碼";
String md5_value = getMD5(s.getBytes());
其中getBytes函數使用平臺默認的字符集將string編碼為byte序列。由于平臺的中文編碼方式可能不同,所以同一中文經過getBytes得到的二進制是不一樣的。為保證每次得到的結果一致,或者使用指定的編碼方式得到byte序列,應該在getBytes中使用參數。
String md5_value = getMD5(s.getBytes("utf-8"));
這樣得到的值就是一樣的。
2012年5月14日
crontab命令是Unix/Linux中的一個常用命令,用于設置周期性被執行的指令。沒有用過的可以查一下,在運行服務端程序時會經常用到。 程序使用Java讀取一個含有中文的文件,進行處理后,將結果寫到一個結果文件中。在運行的程序時,出現了這樣一個問題:在本地環境下,運行正確;但是當使用crontab定時執行時,得到的卻是錯誤的結果。 經過一定的調研發現原來是對crontab的機制沒有弄明白導致的。crontab運行程序時,會使用它自己的環境變量,這個環境變量與你本地的環境變量可能會不同。比如,在你本地情況下,環境變量的語言為en_US.UTF-8,而在crontab中,環境變量可能是zh_CN.GBK,這樣會導致讀寫文件時——尤其是讀寫中文文件時內容編碼錯誤,進而導致結果出錯。 所以在使用Java讀寫文件時,一定要指定編碼格式,而不是使用環境變量的格式。例如下面的語句用于讀取utf-8格式的文件:
String encodeType = "utf-8";
File in_file = new File("test.txt");
BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(in_file), encodeType));
網上也有關于修改crontab環境變量的方法,但是我不建議使用,因為一個系統可能是很多人共用的,修改crontab環境變量可能會引起他人程序的問題,最好修改自己的程序,保證它不依賴具體的環境變量。
2011年7月20日
很多同學和朋友經常向我抱怨說,算法已經成為他們學習和工作中的一個負擔。在他們看來,算法只能應付一下考試,在學習中沒有任何用處;也有人說,求職過程中考算法純粹是浪費精力,在實際工作中沒有用到任何算法。
在我的本科四年中,花了大量時間學習算法,參加算法比賽——成績很濫,朋友們都說,和我的付出嚴重不成比例,但是我一點也不后悔花費時間學習算法。算法讓我在平時的學習中應對各個科目都從容自如,學習起來事半功倍。
在平時的學習交流中,有時看其他人的代碼相當別扭,不是看不懂(有時真看不懂),而是很納悶,為什么要這么寫呢,明明有很明顯的順暢的思路,干嗎要寫這么繞呢?我將我覺得正確的思路寫出來的時候,對方也會覺得這樣寫順暢了很多,代碼也小了很多。
在一般應用中,不會說讓你寫一個KMP算法,或者給你設計一個動態規劃的題目讓你來解。但是如果你會這些算法,掌握了這種優化的思想,在平時的編寫中會不知不覺的寫出比較高效的代碼。
有人說,現在中國的軟件現狀就是這樣,不在乎你實現的有多快,只會在乎你有沒有實現所有的功能點,隨著硬件條件的改善,一般情況下都能滿足要求。這樣說也是沒錯,如果你甘愿只做一名碼工,因為對于相當大的一部分軟件,效率并不是最重要的,甚至第二、第三重要都排不上。但是對于企業級的應用和軟件的核心部分,往往效率是非常重要的。
如果將編程和寫作類比的話,可以進行這個的比較。編程必須會語言C/C++、Java、Python等,寫作也一定要會一個語言漢語、英語、法語,當然計算機語言有效率的優劣以及適合的應用的場景,而自然語言沒有這種屬性。算法修養之于編程就像文學修養之于創作,沒有一定的文學修養就寫不出好的作品,同樣沒有良好的算法修養也創造不出好的代碼。數據結構就像寫作中的排比句等,它們是骨架,結構化編程就像是寫作中的段落,它們使得層次分明。
在靜靜的夜晚,明月透過窗子,照進小屋,頓時一種異樣的情懷涌上心頭。這時有下面幾種人,第一種,嚎啕大哭,“媽媽……”;第二種,潸然淚下,“我嚓,想家了是不”;第三種,沉思狀,“有首詩可以表達這個情懷”,拿起全唐詩,查找了整晚,夜盡天明時,驚呼“找到了,原來是‘舉頭望明月,底頭思故鄉’啊,我記得有的。”;第四種,徘徊低吟“舉頭望明月,底頭思故鄉”;第五種,心中油然而生,“獨在異鄉為異客,明月千里寄鄉思”。
同樣地,這也反映了一個程序員算法修養的幾種境界。第一種,菜鳥,不會表達自己的思想,這種多見于初學語言的人,只會寫hello world之類程序的人;第二種,入門,可以表達出自己的想法,但是不懂什么算法,只是憑自己對計算機語言的理解寫程序,當然寫出的程序功能點可能不少,但是不完善,潛在的bug很多;第三種,有一定的算法基礎,但是沒有掌握完全,寫程序時有高效的意識,對一些核心程序,看著資料也能寫出相應的代碼,但是不能活學活用;第四種,有不錯的算法修養,寫出的代碼清晰高效,可勝任關鍵代碼的編寫;第五種,有很高的算法修養,理解了算法的精髓,自己可以得出算法供世人學習,一般是大師級人物。國內有相當一部分程序員就是處于第二階段,他們也有穩定的工作,甚至不錯的收入,但是總感覺遇到了瓶頸,自己的能力躊躇不前。
有人說,現在各種庫都有,那些代碼都非常高效,我只要熟練使用這些庫就行了,不用學習算法。可以達到熟練使用幾個庫的程序員也算是第三階段,但是要想熟練駕馭更多的庫,將庫函數熟練的使用,沒有一定的算法基礎是不行的。比如,如果你想熟練使用STL庫,那么對各種容器和算法都應該有一定的認識,什么時候使用list,為什么快排不能應用于list?要想回答這些問題,必須掌握初步的算法。
對于想要在技術上有一定作為的程序員,沒有算法修養,就如同金庸小說中的學武之人不學習內功,它可以將外功學的爐火純清,憑著這份功力可以走遍半個江湖,但是一旦遇到高手就掛了;反之如果有內功修為,學習外功可學一知十,觸類旁通,內功修為越高將來的成就越大。
學習算法吧!
2011年1月21日
最近做數據時,使用神經網絡建模。在神經網絡中,會用到激發函數(activation function)。
典型的激發函數有Sigmod函數:
雙曲正切函數:
這兩個都涉及到指數函數,在C中,為求指數函數,使用exp()函數。
在數次出錯后找到問題,原來是我的指數值過大,數據中有時會出現超過1000的數字,這導致在求值過程中,即使使用double型,也使得結果溢出。
解決方法是定義一個指數函數,當指數值超過一定界限便指定一個相對無窮大的值,這樣也符合數學定義。在我的處理中,將界限設定為15,當該值大于15時,返回3000000;當界限值小于-15時,返回0。
2010年4月11日
在配置文件共享時,對沒有經驗的用戶會出現很多問題,這里介紹三點注意事項:
1. 首先打開菜單中“工具”->“文件夾選項”->“查看”,確認“使用簡單文件共享”沒有被選上;
2. 右鍵“我的電腦”,“管理”->“系統工具”->“本地用戶和組”->“用戶”,右鍵“Guest”,“屬性”,在“常規”選項卡中,取消“賬戶已停用”;
3. 打開“控制面板”->“管理工具”->“本地安全策略”,打開“本地策略”->“用戶權利指派”,雙擊“拒絕從網絡訪問這臺計算機”,確認其中的“guest”已刪除。
本文針對XP用戶,其它用戶可參照。
2009年4月29日
賦值運算符和復制構造函數都是用已存在A的對象來創建另一個對象B。不同之處在于:賦值運算符處理兩個已有對象,即賦值前B應該是存在的;復制構造函數是生成一個全新的對象,即調用復制構造函數之前B不存在。
CTemp a(b); //復制構造函數,C++風格的初始化
CTemp a=b; //仍然是復制構造函數,不過這種風格只是為了與C兼容,與上面的效果一樣
在這之前a不存在,或者說還未構造好。
CTemp a;
a=b; //賦值運算符
在這之前a已經通過默認構造函數構造完成。
我覺得將賦值運算符稱為“
賦值構造函數”是錯誤的,構造函數發生在對象創建時期,而賦值是運算符,發生在“運算”時期,賦值運算前,對象已經構造完成,所以不能稱之為“構造函數”。
一家之言!!