단축키
shift+ctrl+m : %>%파이프라인
shift+ctrl+c : 주석
alt + - : <-
ctrl+enter : 명령어실행
변수생성하기
c() : combine함수. 변수 생성시 꼭 필요함
v <- c(1,2,3,4,5)
v
[1] 1 2 3 4 5
v2 <- c(1:5)
v2
[1] 1 2 3 4 5
str <- c("a","b","c")
str
[1] "a" "b" "c"
숫자형 변수, 문자형 변수 모두 여러개 넣을 때는 c로 묶어줘야함
c(1:5)는 콜론을 사용해서 1~5까지 1씩 증가하면서 연속된 숫자로 변수를 만든다
연속함수 Sequence, seq(시작 숫자, 마지막 숫자, by=간격)
v4 <- seq(0,10,by=2)
> v4
[1] 0 2 4 6 8 10
paste / paste0 :문자 합치기
paste("Hello","world","is","good!") # 기본값이 빈칸
[1] "Hello world is good!"
paste0("Hello","world","is","good!") # 빈칸없이 붙일 때
[1] "Helloworldisgood!"
python에서는 문자를 합칠 때 "+"를 사용함
R에서는 문자를 합칠 때 paste() 사용, 기본값 빈칸
paste0는 빈칸없이 붙일 때 사용
통계량 구하기
# 간단한 기술통계량 계산하기 = 요약통계량
> # 연속형 변수에 해당
> # 최소값 = 0분위수
> # 1분위수 = 25분위수
> # 2분위수 = 50분위수 = 중앙값(median)
> # 3분위수 = 75분위수
> # 최대값 = 4분위수 = 100분위수
> # 평균
> summary(example) #python에서는 describe()
id class
Min. : 1.00 Min. :1
1st Qu.: 5.75 1st Qu.:2
Median :10.50 Median :3
Mean :10.50 Mean :3
3rd Qu.:15.25 3rd Qu.:4
Max. :20.00 Max. :5
math english
Min. :20.00 Min. :56.0
1st Qu.:45.75 1st Qu.:78.0
Median :54.00 Median :86.5
Mean :57.45 Mean :84.9
3rd Qu.:75.75 3rd Qu.:98.0
Max. :90.00 Max. :98.0
science
Min. :12.00
1st Qu.:45.00
Median :62.50
Mean :59.45
3rd Qu.:78.00
Max. :98.00
example이란 데이터는 id, class 수학 영어 과학 점수를 포함하고 있는 데이터
summary를 사용하면 빠르게 최소값부터 평균 최대값 분위수까지 나타내줌
혼자 해보기 문제 - 3장
- Q1. 시험 점수 변수 만들고 출력하기80, 60, 70, 50, 90앞 문제에서 만든 변수를 이용해서 이 학생들의 전체 평균 점수를 구해보세요.전체 평균 점수를 담고 있는 새 변수를 만들어 출력해 보세요. 앞 문제를 풀 때 사용한 코드를 응용하면 됩니다.
- Q2. 전체 평균 구하기
- Q3. 전체 평균 변수 만들고 출력하기
#Q1
score<-c(80,60,70,50,90)
#Q2
mean(score)
#Q3
mean_score<-mean(score)
참고 - Do it! 쉽게 배우는 R데이터 분석
'R' 카테고리의 다른 글
R dplyr 패키지 이용하기 - %>% 파이프라인 연산자 (1) | 2024.07.08 |
---|---|
R 기초문법 - 변수명 수정 rename, 조건문 ifelse (0) | 2024.07.08 |
R 기초문법 - 외부데이터 가져오기, csv 파일 읽기, text 파일 읽기 (0) | 2024.07.06 |
R 기초문법 - R 데이터 타입, 구조 정리 (0) | 2024.07.06 |
R 기초문법 - install.packages() 패키지 설치하기 (2) | 2024.07.04 |