Apache Tajo
Apache Tajo란?
시작하기
준비 사항
다운로드 및 소스코드 풀기
소스코드 빌드
로컬 클러스터 셋업
첫 질의 실행
Configuration
Preliminary
Cluster Setup
Tajo Master Configuration
Worker Configuration
Catalog Configuration
High Availability for TajoMaster
Cluster Service Configuration Defaults
The tajo-site.xml File
The catalog-site.xml File
Tajo Shell (TSQL)
Meta Commands
Executing HDFS commands
Session Variables
Administration Commands
Introducing to TSQL
Executing a single command
Executing Queries from Files
Executing as background process
SQL 언어 (Tajo 질의 언어)
데이터 모델
데이터 정의 언어 (DDL, Data Definition Language)
데이터 삽입: INSERT (OVERWRITE) INTO
질의하기
SQL 수식
연산자
타임존(Time Zone)
서버 클러스터 타임존 (Server Cluster Time Zone)
테이블 타임존 (Table Time Zone)
클라이언트 타임존 (Client Time Zone)
Time Zone ID
타임존 사용 예제
Functions
수학함수와 연산자들
문자열 함수와 연산자들
날짜 및 시간 함수와 연산자들
네트워크 함수와 연산자들
테이블 관리
Apache Tajo 테이블 관리 개요
파일 포맷
압축
테이블 파티셔닝
파티셔닝 소개
컬럼 파티셔닝
범위 파티셔닝 (Range Partitioning)
해쉬 (Hash) 파티셔닝
Backup and Restore
Backup and Restore Catalog
HCatalog 통합
Tajo JDBC Driver
How to get JDBC driver
Setting the CLASSPATH
An Example JDBC Client
FAQ
Tajo Client API
FAQ
Apache Tajo
Docs
»
테이블 관리
»
파일 포맷
View page source
파일 포맷
¶
현재, Tajo는 아래와 같이 네가지의 파일 포맷을 제공합니다.
CSV (TextFile)
RCFile
Parquet
SequenceFile