zkvn99

[R] 데이터 탐색 본문

Language/R

[R] 데이터 탐색

zkvn1103 2023. 4. 4. 13:34

범주형 데이터 - 질적 데이터라고도 부르며, 범주 또는 그룹으로 구분할 수 있는 값으로 구성된 데이터

연속형 데이터 - 양적 데이터라고도 부르며, 크기가 있는 숫자들도 구성된 데이터

 

변수의 개수에 따른 분류

 

단일변수 데이터 

하나의 변수로만 구성된 데이터, '일변량 데이터'라고도 부름


다중변수 데이터 

두 개 이상의 변수로 구성된 데이터, 다변량 데이터라고 부름 ,특히 두 개의 변수로 구성된 데이터를 '이변량 데이터'라고 함

 

 

도수분포표

favorite <- c('WINTER','SUMMER','SUMMER','SUMMER','SUMMER','SPRING','SPRING','SPRING','FALL','FALL')
table(favorite) // 도수분포표 계산
table(favorite)/length(favorite) // 비율

 

상관분석과 상관계수 (피어슨 상관계수)

-1  ≤ r  ≤ 1

r > 0 : 양의 상관관계(x 증가하면 y 증가)

r < 0 : 음의 상관관계(x 증가하면 y 감소)

'Language > R' 카테고리의 다른 글

[R] 데이터 다루기  (0) 2023.03.28
[R] 데이터 프레임  (0) 2023.03.14
[R] 변수, 함수  (0) 2023.03.07