분산 데이터 스트리밍 플랫폼분산 : 하나의 서버가 아니라 여러 대의 서버(브로커)가 협력해서 데이터를 나누어 저장하고 처리스트리밍 : 데이터를 저장함과 동시에 바로 소비할 수 있도록 설계 (데이터가 끊어지지 않고 지속적으로 흐르는 개념)플랫폼 : 여러 시스템이 데이터를 주고받을 수 있도록 연결해 주는 중심 역할카프카 파일시스템 기반 저장카프카는 데이터를 저장할 때 메모리가 아니라 디스크에 저장함으로써 별도 설정없이 영속성 보장디스크 I/O 비용이 상대적으로 높은데, 카프카 브로커의 로컬 디스크에 저장하지만 빠른 이유순차 I/O랜덤 액세스 대비 150000배 빠르고 메모리 랜덤 액세스보다 빠르다원하는 데이터가 위치한 블록을 찾기 위한 시간(seek time) - 순차I/O 를 통해 최소화블록을 메모리에 카..