[통계학] 횡단면, 시계열, 패널 자료 개념 정리

#통계학을 현실에서 사용하기 위해서는 실제 수집된 데이터가 필요합니다. 통계학에서 아주 기본이 되는 수집된 데이터의 종류인 횡단면, 시계열, 패널 자료의 개념에 대해 정리해 보았습니다.

그림으로 간단하게 표현하자면 아래와 같습니다.

횡단면, 시계열, 패널 자료

아래의 각 개념을 위 그림과 함께 보면서 이해하면 좋겠네요.

횡단면 자료

#횡단면 자료(Cross-sectional data) 는 하나의 시점 혹은 기간에 관찰된 여러 변수의 관측치를 의미합니다. 특정 시점 시점이라는 점이 가장 중요한 특징입니다.

위 그림에서는 2000년의 각 기업 매출액이 바로 횡단면 자료입니다.

시계열 자료

#시계열 자료(종단면 자료, Time-series data)는 하나의 변수여러 시점에 대해 관측한 자료를 의미합니다. 횡단면 자료와 다른 점은 하나의 변수에 대해 여러 시점 혹은 기간 동안 관측된 자료라는 점입니다.

위 그림에서는 기업 A의 연도별 매출액이 바로 시계열 자료인 것입니다.

패널 자료

#패널 자료(Panel data) 는 횡단면 자료와 시계열 자료가 혼합된 형태라고 이해하면 됩니다. 여러 시점에 대해 관측된 여러 변수의 자료가 모두 존재하는 경우입니다.

위 그림에서 보이는 표, 즉 기업 A, B, C, D 의 2000년 부터 2004년 까지 관측된 모든 매출액 자료 전체가 바로 패널 자료인 것입니다.


자료의 종류를 구분하는 것은 매우 기초적인 것이지만, 분석 대상과 방법을 설정함에 있어서 가장 중요한 부분이니 반드시 숙지하고 있어야 합니다.