오랜만에 다시 R언어를 공부한 스터디 메모이다.
R언어는 dplyr 패키지를 이용하면 코드 가독성이 좋아진다.
# 경고 메세지 없이 dplyr 패키지 불러오기
library(dplyr, warn.conflicts = FALSE)
데이터 프레임의 값에 액세스 하는 방법.
# 시리즈_ex1 생성
시리즈_ex1 <- c(100, 500, 150)
names(시리즈_ex1) <- c('카카오', '삼성전자', '현대차')
# df_ex1 생성
df_ex1 <- data.frame(가격=c(100, 500, 150), PER=c(0.5, 1.2, 0.2), ROA=c(1.01, 3.1, 0.97), row.names=c('카카오', '삼성전자', '현대차'))
# 출력
print(df_ex1$가격)
print(df_ex1['삼성전자', '가격'])
print(df_ex1['카카오', ])
print(df_ex1['카카오', 'ROA'])
칼럼 전체에 액세스 할 때 '$' 기호를 사용하는 게 특이하다.
R언어 데이터 프레임의 셀에 액세스 할 때, [행, 열] 형식으로 접근한다.
파이썬 pandas의 데이터 프레임에서 셀에 액세스 할 때는 [열, 행] 형식으로 접근하는 것과 대비된다.
파이썬 pandas에서도 loc 프로퍼티를 사용하면 [행, 열] 형식으로 셀에 액세스할 수 있기는 하지만 굳이??
개인적으로 R언어가 더 편하게 느껴진다.
'데이터 분석' 카테고리의 다른 글
R언어 데이터 프레임 사용법 예제 2. (0) | 2024.05.30 |
---|---|
R언어 절사 평균 mean trim (0) | 2023.06.28 |
R언어 무료 IDE (0) | 2023.06.28 |
무료 R언어 강의 영상 (0) | 2023.06.26 |
윈저화 평균 (winsorized mean) (0) | 2023.04.28 |