Javen-Studio 咖啡小屋

http://javenstudio.org - C++ Java 分布式搜索引擎
Naven's Research Laboratory - Thinking of Life, Imagination of Future

C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合

:: 管理 ::

24 隨筆 :: 57 文章 :: 170 評論 :: 4 Trackbacks

<

2006年3月

>

日

一

二

三

四

五

六

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

常用鏈接

留言簿(42)

文章檔案

最新評論

1.?re: SOCKET的封裝
看了你的文章，感覺封裝的不錯。能給我一份源代碼嗎？@Javen-Studio
gypzfabc@126.com
--莫莫
2.?re: SOCKET的封裝
寫的真好。能發(fā)給我一份嗎？283063526@qq.com
--陳甜
3.?re: SOCKET的封裝
寫的真好。能發(fā)給我一份嗎？weiqinyu2005@163.com
--weiqinyu
4.?re: 侯捷《C++/OOP/GP/DP》講座心得
學(xué)習(xí)了
--溪流
5.?re: 侯捷《C++/OOP/GP/DP》講座心得
看了這么多UML的文章都沒明白聚合和組合的區(qū)別，都是互相抄，看了您的文章終于明白了，謝謝
--dangerman

Hawk-0.4.35開發(fā)版搜索引擎平臺發(fā)布

      Hawk 搜索引擎平臺是面向中小型網(wǎng)站，可以定制的垂直搜索引擎平臺。本搜索引擎平臺
目標(biāo)是方便用戶搭建站內(nèi)搜索、某個領(lǐng)域的垂直搜索、以及檢索個人文檔以及自己關(guān)注的
網(wǎng)站信息的桌面搜索等應(yīng)用領(lǐng)域。它改造自Lucene/Hadoop/Nutch系統(tǒng)，是純Java的搜索平臺軟件，
可以運(yùn)行于Windows及Linux等平臺。目前發(fā)布版本為初始版本Hawk-0.4.35-test版，具備基本的
抓取、索引和檢索功能，本搜索引擎將免費(fèi)提供，歡迎大家測試和使用，謝謝！
      下一個版本將實(shí)現(xiàn)可根據(jù)語法以及新詞進(jìn)行分詞的分詞模塊，以及抓取數(shù)據(jù)的過濾及優(yōu)化，
索引的消重等方面，以實(shí)現(xiàn)可以應(yīng)用于實(shí)際在線產(chǎn)品的版本。
      下面介紹本搜索引擎的使用和演示版本：

      1, 下載和安裝
      a. 請下載Java運(yùn)行環(huán)境，推薦Java SE 1.6版本
      b. 下載Hawk-0.4.35-test（稍后提供，謝謝）
      c. 解壓：tar -zxf hawk-0.4.35-test.tar.gz
      d. 假設(shè)Hawk已被解壓到 ~/hawk-0.4.35 目錄，以下敘述以 $HAWK表示

      2, 配置
      a. 將Java運(yùn)行環(huán)境的bin目錄添加到系統(tǒng)PATH環(huán)境變量中，同時修改$HAWK/conf/hawk-env.sh
文件設(shè)置正確的Java路徑。備注：Java缺省會安裝在/usr/java目錄下
      b. 也可以將hawk解壓后目錄 $HAWK/bin 添加到PATH環(huán)境變量中，方便啟動和停止Hawk服務(wù)。
      c. 修改 $HAWK/conf/hawk-site.xml 文件中的“search.dir”的值為索引數(shù)據(jù)存放路徑，如
<property>
<name>searcher.dir</name>
<value>/tmp/hawkdb</value>
</property>

      d. Hawk系統(tǒng)服務(wù)會綁定若干個端口，請查看$HAWK/conf/site.xml，酌情修改

      3, 訪問
      a. 啟動Hawk服務(wù)：運(yùn)行 $HAWK/bin/start-hawk.sh 和 $HAWK/bin/start-server.sh 腳本
      b. 訪問Hawk管理界面（缺省端口為20090），例如：http://localhost:20090/