*************** Apache Tajo란? *************** Apache Tajo 프로젝트의 핵심목표는 웹-스케일의 대규모 데이터를 처리하기 위한 하둡 기반의 데이터 웨어하우스 시스템을 오픈소스로 구축하는 것입니다. Tajo는 표준 SQL을 질의 언어로 지원합니다. 또한, Tajo는 하둡 분산 파일 시스템 상의 데이터를 포함한 여러 형태의 데이터에 대해 인터랙티브 (interactive) 질의와 배치 (batch) 질의 모두를 지원하도록 설계되어 있습니다. 빠른 질의 처리 시간을 보장하면서, Tajo는 내고장성 (fault-tolerance) 과 실시간 로드 밸런싱 (dynamic- load balancing) 을 제공합니다. 보다 빠른 성능을 위해 Tajo는 비용기반 최적화 (cost-based optimization) 와 더불어 점진적 최적화 (progressive optimization) 기술을 활용하여 처리중인 질의를 재-최적화 합니다. 이를 통해 가장 성능이 나쁜 질의 실행 계획은 사용하지 않도록 합니다.