技術發展日新月異, 由于長期的學習和工作原因, 積累了一些想法, 想逐步實現一個(或一些)較大的可以直接
商業運營的系統, 大致包括分布式存儲系統, 分布式計算系統, 大表數據存儲系統, 搜索引擎平臺, 網頁抓取平臺等, 主要從hawk系統發展而來, 技術主要來自google GFS/MapReduce/BigTable, 以及hadoop等, 希望能實現一套較
完整google技術平臺以應用于普通企業甚至個人的集群存儲和計算處理, 主要還是改造自hadoop. 另外本人的hawk搜索系統屬于一個實驗產品,所以有很多不完善,hawk-6.22應該是個較穩定的
版本,如果希望得到源碼請直接參考hadoop/lucene/nutch等,另外由于一直較忙,而且相關文檔屬于副產品,寫好也不容易,難以持續,個人建議直接看開源產品源碼更好:) 謝謝關注