by CodeJin19
~1 min read

Categories

Tags

하둡 2장 맵리듀스

오늘은 2장을 좀 더 읽었다.


JAVA로 구현한 Mapper, Reducer 메서드 코드들을 보면서 맵리듀스가 어떻게 작동하는지 알 수 있었다.

오늘은 2장을 끝까지 읽어보려고 했으나, 2장 후반부 “Scailing Out” 챕터부터 이해가 잘 안 됐다.

(그래서 정리도 못했다)

2장의 후반부를 이해하지 못한 가장 큰 까닭은 HDFS를 모르기 때문이다.

2장의 전반부가 로컬 파일시스템 환경에서의 맵리듀스를 다뤘다면, 2장의 후반부에서는 이를 확장한, HDFS에서의 맵리듀스를 다루는데,

HDFS에 대한 이해가 없다보니, 거먼 것은 글이요, 허연 것은 종이겠거니… 하고 있었다.

마침 3장이 HDFS였던 터라, 2장은 이쯤에서 마무리하고, 3장을 읽고 다시 읽어보기로했다.