zkvn99

[R] 데이터 프레임 본문

Language/R

[R] 데이터 프레임

zkvn1103 2023. 3. 14. 11:09

데이터 프레임 생성 2가지

eng_score <- c(100,90,80,70)  // 영어 점수 변수 생성
math_score <- c(90,80,70,60)  // 수학 점수 변수 생성

df_midterm <- data.frame(eng_score, math_score)  // 데이터 프레임 생성
df_midterm // 출력

출력 

 eng_score math_score
1      100         90
2       90         80
3       80         70
4       70         60
df_midterm1 <- data.frame(eng_score = c(50, 40, 30, 20),
			  math_score = c(70, 60,50 ,40))
              
df_midterm1

출력

  eng_score math_score
1        50         70
2        40         60
3        30         50
4        20         40

 

데이터 프레임 추가

class <- c('a','b','c','d') // 반 변수 생성
df_midterm <- data.frame(eng_score, math_score, class) // 데이터 프레임 반 변수 추가
df_midterm

 

출력

 

eng_score math_score class
1     100         90     a
2      90         80     b
3      80         70     c
4      70         60     d

데이터프레임$열 => 프레임의 특정 속성

 

mean() - 평균 산출

head() - 데이터 앞부분 출력 (default 6줄) head(데이터,n) 앞에서 n행까지
tail() - 데이터 뒷부분 출력 (default 6줄) tail(데이터,n) 뒤에서 n행까지
View() - 뷰어 창에서 데이터 확인
dim() - 데이터 차원 출력 (몇행, 몇열)
str() - 데이터 속성 출력
summary() - 요약통계량 출력

 

readxl 패키지 설치 및 사용

install.packages("readxl") // 패키지 설치
library(readxl) // 라이브러리 사용

df_exam <- read_excel("d:/excel_exam.xlsx") // 엑셀 경로 지정 후 데이터 읽기

df_exam_data <- read_excel("excel_exam_data.xlsx", col_names = F) 
// 첫 번째 행이 변수명이 아닌 데이터인 경우 col_name = F 사용

df_exam_sheet <- read_excel("excel_exam_sheet.xlsx", sheet = 3)
// 특정 시트만 불러올 때 사용

 

한글이 저장된 csv 파일 사용

install.packages("readr") // 패키지 설치
library(readr) // 라이브러리 사용

df_csv_exam <- read.csv("csv_exam.csv", header = F)
// 첫번째 행에 변수명이 없는 파일을 불러올 때는 header = F
write.csv(df_midterm, file = "df_midterm.csv")
//csv 파일로 저장

City_kor<- data.frame(city = c('서울', '경기', '인천', '부산'), code = c(1,2,3,4))
write.csv(City_kor, 'city.csv', row.names=F, fileEncoding = 'cp949')
data_test <- read_csv("city.csv",locale=locale('ko',encoding='cp949'))

mpg 데이터 파악하기

install.packaes(“ggplot2”)
as.data.frame() // 데이터 속성을 데이터 프레임 형태로 바꾸는 함수
ggplot2::mpg // ggplot2에 들어 있는 mpg데이터를 지칭하는 코드

mpg <- as.data.frame(ggplot2::mpg)
// ggplot2의 mpg 데이터를 데이터 프레임 형태로 불러오기

mpg1 <- rename(mpg, c(“변경 전 변수이름” = “변경 후 변수이름")) 
// year의 이름을 year약자로 수정

mpg10 <- mpg1
// 새로운이름으로 기본의 프레임을 복사

'Language > R' 카테고리의 다른 글

[R] 데이터 탐색  (0) 2023.04.04
[R] 데이터 다루기  (0) 2023.03.28
[R] 변수, 함수  (0) 2023.03.07