[STATA] in 명령어 사용법 개념 정리

아래는 통계 패키지 STATA 에서 in 명령어를 사용하는 방법을 정리한 내용입니다. 기본적으로 do-editor 에서의 사용을 기본으로 합니다.

in

in 명령어의 개념은 간단합니다. 무언가 데이터 작업을 처리 할 때 특정 전체 데이터가 아닌 특정 데이터만 선택해서 처리 하기 위해 데이터를 선택하는 것입니다. 아래의 예제를 보면 조금더 쉽게 이해 할 수 있습니다.

기본적으로 1,000 개의 데이터가 있다고 가정하고 아래 예제를 봅시다.

아래는 1,000 개의 기존 데이터 테이블에 새로운 열을 추가 하고 101번째 부터 200번째 데이터 까지만 새로운 데이터를 넣어주는 코드입니다.

generate colNew = 99 in 101/200

colNew 라는 이름의 새로운 열을 만들고 101번째 부터 200 번째 까지의 행에만 99 라는 숫자를 넣는 작업입니다.

이 경우 colNew 라는 새로운 열 생성이므로 colNew 열에서 101번째 부터 200번째 행을 제외한 나머지 행에는 missing value 가 들어갑니다.

아래는 기존의 데이터 중 201번째 데이터 부터 300 번째 까지의 기존 데이터의 값을 108 이라는 숫자로 변경 하는 코드입니다.

replace col1 = 108 in 201/300

참고로 위 두 예제에서 알 수 있듯이 STATA 에서 데이터를 선택할 때는 (선택을 시작한 데이터 행 번호)/(선택을 끝낼 데이터 행번호) 와 같은 방법을 사용합니다.

STATA 에서 in 명령어는 여러 상황에서 굉장히 많이 쓰이니 잘 숙지 하고 있으면 좋습니다.