본문 바로가기
R

R 기초문법 - seq, paste, summary

by d22pinsights 2024. 7. 4.

단축키

shift+ctrl+m : %>%파이프라인
shift+ctrl+c : 주석
alt + - : <-

ctrl+enter : 명령어실행

 

변수생성하기

c() : combine함수. 변수 생성시 꼭 필요함

v <- c(1,2,3,4,5)
v
[1] 1 2 3 4 5
v2 <- c(1:5)
v2
[1] 1 2 3 4 5
str <- c("a","b","c")
str
[1] "a" "b" "c"

숫자형 변수, 문자형 변수 모두 여러개 넣을 때는 c로 묶어줘야함

c(1:5)는 콜론을 사용해서 1~5까지 1씩 증가하면서 연속된 숫자로 변수를 만든다

연속함수 Sequence, seq(시작 숫자, 마지막 숫자, by=간격)
v4 <- seq(0,10,by=2)
> v4
[1]  0  2  4  6  8 10

 

paste / paste0 :문자 합치기
paste("Hello","world","is","good!") # 기본값이 빈칸
[1] "Hello world is good!"
paste0("Hello","world","is","good!") # 빈칸없이 붙일 때
[1] "Helloworldisgood!"

python에서는 문자를 합칠 때 "+"를 사용함

R에서는 문자를 합칠 때 paste() 사용, 기본값 빈칸

paste0는 빈칸없이 붙일 때 사용

 

통계량 구하기

# 간단한 기술통계량 계산하기 = 요약통계량
> # 연속형 변수에 해당
> # 최소값 = 0분위수
> # 1분위수 = 25분위수
> # 2분위수 = 50분위수 = 중앙값(median)
> # 3분위수 = 75분위수
> # 최대값 = 4분위수 = 100분위수
> # 평균
> summary(example)  #python에서는 describe()
       id            class  
 Min.   : 1.00   Min.   :1  
 1st Qu.: 5.75   1st Qu.:2  
 Median :10.50   Median :3  
 Mean   :10.50   Mean   :3  
 3rd Qu.:15.25   3rd Qu.:4  
 Max.   :20.00   Max.   :5  
      math          english    
 Min.   :20.00   Min.   :56.0  
 1st Qu.:45.75   1st Qu.:78.0  
 Median :54.00   Median :86.5  
 Mean   :57.45   Mean   :84.9  
 3rd Qu.:75.75   3rd Qu.:98.0  
 Max.   :90.00   Max.   :98.0  
    science     
 Min.   :12.00  
 1st Qu.:45.00  
 Median :62.50  
 Mean   :59.45  
 3rd Qu.:78.00  
 Max.   :98.00

example이란 데이터는 id, class 수학 영어 과학 점수를 포함하고 있는 데이터

summary를 사용하면 빠르게 최소값부터 평균 최대값 분위수까지 나타내줌

 

혼자 해보기 문제 - 3장
  1. Q1. 시험 점수 변수 만들고 출력하기80, 60, 70, 50, 90앞 문제에서 만든 변수를 이용해서 이 학생들의 전체 평균 점수를 구해보세요.전체 평균 점수를 담고 있는 새 변수를 만들어 출력해 보세요. 앞 문제를 풀 때 사용한 코드를 응용하면 됩니다.
  2. Q2. 전체 평균 구하기 
  3. Q3. 전체 평균 변수 만들고 출력하기
#Q1
score<-c(80,60,70,50,90)
#Q2
mean(score)
#Q3
mean_score<-mean(score)

 

참고 - Do it! 쉽게 배우는 R데이터 분석