2013年4月8日 星期一

最近 hadoop 的感想


不知道有多少人裝過 hadoop,尤其是在多台機器上,來產生一個 Cluster。一堆電腦幫忙做事情,總是比一台電腦快多了。

最近我身旁很多人都為了課程、研究需求,安裝 hadoop。但是每個都出現了我沒見過的問題。當我拿起對方所參考的安裝手冊時,發現每個都在 root。

也許大家在 Windows 上玩久了,對 root 沒什概念。然後一到 Linux 上,就恐惧了。因為某此指令需要 root,某些不用。用錯了,不但會有問題,也會增加日後維護的麻煩

另外就是,大家知道 /home 擺的是自己的東西,但是很多文件都把 hadoop 擺到奇怪的地方。特別的是,我自己安裝時,能不 root 就不 root,所以 hadoop 的資料夾是建在 /home 下。這樣就可以跑的東西,但是大家就是喜歡到其它地方,建新的資料夾,然後新的資料夾只能給 root 使用。

結論:建議大家,除了有必要,能不用 root 就不要用 root 吧。筆者曾經手賤建立了一個資料夾,結果權限錯誤,Debug 了很久才解決;而那次的結論是:讓他自己建立就好,我們不用插手。要 root 的地方,不多。基本上就是設定一些文件而以。設定完後,全部都可以在不 root 的情況下進行。



2013.04.09 Edit:

目前聽到最好的答案,就是安全性問題。如果把 hadoop 資料夾,放在 /home 的話,使用者可任意編修,最後造成系統問題。所以企業通常都是放在 /opt 資料夾。