Small Talk

Hadoop 완벽 가이드 : 클라우드 컴퓨팅 구축을 위한 실전 안내서(개정판) - 한빛미디어

주나니 2011. 6. 27. 01:32



  Hadoop을 처음 구경(?) 했던 건 지금으로 부터 대략 4년전이었다. 당시 대학원 진학을 앞두고 연구실에 들어가서 연구 프로젝트로 검색 엔진을 개발한 적이 있었다. 오픈소스인 Lucene, Nutch를 기반으로 활용하기 위해서 소스를 분석하고, 관련 지식을 수집하다 보니 Hadoop이 나타났다. 이게 대체 뭘까, 왜 쓰는거지라는 의문이 들었지만 답은 인터넷 검색을 통해서 쉽게 얻었다. 대용량 데이터를 효과적으로 관리하고, 처리하기 위해서였다. 이 때부터 기회가 되면 Hadoop을 공부해봐야지라는 생각을 갖고 있었는데 운좋게도 한빛리더스 활동을 마감하는 돌발 미션을 통해 이 책을 접하게 되었다.

  요즈음 가장 주목 받고 있는 기술이 뭐냐고 묻는다면 클라우드 컴퓨팅이라고 할 수 있다. 클라우드 컴퓨팅에서 중요한 기술은 여러가지가 있겠지만, 대용량 데이터 처리가 기반이 되어야한다. 이 책은 '클라우드 컴퓨팅 구축을 위한 실전 안내서' 라는 부제처럼 Hadoop을 활용해서 클라우드 컴퓨팅을 구축할 수 있는 방법을 알려준다. 책은 데이터 홍수가 일상적인 현상이 되버린 현실에 대한 간략한 원인 분석을 시작으로 Hadoop을 구성하고 있는 기술들, 관리 방법, Hadoop과 함께 사용하면 좋은 기술들, 실제 사례등을 포함하고 있다. 

  이 책의 장점은 Hadoop을 사용해서 클라우드 컴퓨팅을 구현할 수 있도록, 개념 및 이론 설명, 간략하면서도 수준 높은 예제 소스, 그림과 표가 잘 어우러져 있다는 점이다. Hadoop의 내부적인 모든 것을 이해하기 위해서는 깊고도 넓게 다양한 지식을 갖고 있어야 한다.  Hadoop 자체가 어려운 개념과 기술을 사용하기 쉽도록 추상화해서 구현하고 구성해 놓았고, 이 책은 이를 잘 설명하고 있다는 점은 아주 큰 장점이라고 생각한다. 또, Hadoop이 실제 적용된 사례를 분석해서 잘 설명해 놓았는데, 이 부분은 실제적으로 어떻게 Hadoop을 활용할 수 있을지에 대한 좋은 참고가 될 수 있을 것 같다.

  굳이 단점을 꼽으라면 책의 난이도가 높은 편이다. 완벽한 이해를 위해서는 다양한 지식을 필요로 한다. 클라우드 컴퓨팅에 대해 흥미를 가졌다고 바로 덤벼들었다가는 좌절할지도 모른다. 그렇지만 앞으로 처리해야할 데이터는 기하급수적으로 늘어날 것이며, 더 효율적이고 효과적인 데이터 처리방법을 필요로 할 것이다. 그럼에도 불구하고, 클라우드 컴퓨팅에 관심을 가지고 있다면, 대용량 데이터 처리에 관심이 있다면, 꼭 한번 읽어봐야 하는 책이 아닐까 생각한다. 누군가 관심이 있다고 얘기한다면 주저 없이 이 책을 추천해 주고 싶다.

ps. 마침 '이거 Hadoop 공부해서 활용하면 되지 않을까?' 라고 고민하던 문제가 있었는데, 아이디어 정리해서 시도해봐야겠다. ^^