[Bigdata] - 빅데이터 기초 05 : 빅데이터 저장에 대한 개념

외부 소스에서 얻은 데이터의 비호환성을 해결하고 저장과 처리를 위해 데이터 랭글링(data wrangling)이 필요하다. 데이터 랭글링에는 다운스트림 분석을 위한 데이터 여과, 정제 및 준비 단계가 포함된다. 저장 장치의 관점에서 보면 처음에는 데이터의 복사본이 원본 형식으로 저장디고, 랭글링이 끝나면 처리된 데이터가 다시 저장되는 것이다. 일반적으로 다음과 같은 경우, 저장 장치가 필요하다.

Continue reading

Pagination