[STATA] in 명령어 사용법 개념 정리

아래는 통계 패키지 STATA 에서 in 명령어를 사용하는 방법을 정리한 내용입니다. 기본적으로 do-editor 에서의 사용을 기본으로 합니다.

in

in 명령어의 개념은 간단합니다. 무언가 데이터 작업을 처리 할 때 특정 전체 데이터가 아닌 특정 데이터만 선택해서 처리 하기 위해 데이터를 선택하는 것입니다. 아래의 예제를 보면 조금더 쉽게 이해 할 수 있습니다.

예제

기본적으로 1,000 개의 데이터가 있다고 가정하고 아래 예제를 봅시다.

데이터 생성

아래는 1,000 개의 기존 데이터 테이블에 새로운 열을 추가 하고 101번째 부터 200번째 데이터 까지만 새로운 데이터를 넣어주는 코드입니다.

generate colNew = 99 in 101/200

colNew 라는 이름의 새로운 열을 만들고 101번째 부터 200 번째 까지의 행에만 99 라는 숫자를 넣는 작업입니다.

이 경우 colNew 라는 새로운 열 생성이므로 colNew 열에서 101번째 부터 200번째 행을 제외한 나머지 행에는 missing value 가 들어갑니다.

데이터 변경

아래는 기존의 데이터 중 201번째 데이터 부터 300 번째 까지의 기존 데이터의 값을 108 이라는 숫자로 변경 하는 코드입니다.

replace col1 = 108 in 201/300

참고로 위 두 예제에서 알 수 있듯이 STATA 에서 데이터를 선택할 때는 (선택을 시작한 데이터 행 번호)/(선택을 끝낼 데이터 행번호) 와 같은 방법을 사용합니다.


STATA 에서 in 명령어는 여러 상황에서 굉장히 많이 쓰이니 잘 숙지 하고 있으면 좋습니다.