Posted on 2010-10-07 22:24
Kevin_Zhang 閱讀(333)
評論(0) 編輯 收藏 引用 所屬分類:
搜索引擎 、
Heritrix
1.下載heritrix-1.14.1.zip和heritrix-1.14.1.src 并解壓,解壓heritrix-1.14.1.jar.
2.在eclipse下創建java project,命名為比如heritrix,進入其工程的目錄,我的是F:\workspace\myeclipse\heritrix,刪除src文件夾。
3.copy解壓后的heritrix-1.14.1.zip文件夾下的lib,webapps,heritrix-1.14.1到F:\workspace\myeclipse\heritrix目錄下,并刪除F:\workspace\myeclipse\heritrix\heritrix-1.14.1目錄下的org和st兩個文件夾。
copy解壓后的heritrix-1.14.1.src 文件夾下的heritrix-1.14.1\src\java下的org和st兩個文件夾到F:\workspace\myeclipse\heritrix\heritrix-1.14.1\目錄下
4.修改heritrix-1.14.1文件夾名稱為src
5.修改src\heritrix.properties文件中的heritrix.cmdline.admin = 為 heritrix.cmdline.admin = admin:sun,這個就是要設置你的用戶名和密碼,可以隨便,中間是冒號。
6.刷新工程,把lib下的jar包全部添加到工程中,即點擊heritrix工程,右鍵屬性---java build path---libraries--- add jars選擇heritrix工程下lib所有jar。
7.運行org.archive.crawler.Heritrix類,在地址欄輸入http://localhost:8080/
OK!就是這么簡單!
轉自:
http://zhidao.baidu.com/question/72080439.html