임상의학 연구자, 보다 쉽고 빠르게 R 데이터 분석에
입문하기 원하는 연구자들을 위한 필독서
데이터 분석 도구로서 R 프로그램의 효용은 실로 크다. 반복적 작업을 피해 빠르게 작업할 수 있으며, 재현성이 뛰
어나 분석결과를 신뢰할 수 있고, 우수한 시각화 기능으로 다양한 그래프를 구현할 수 있다. 또한 온라인에서 수많
은 이들과 소통하며 코드를 공유하고, 자신만의 함수를 만들어 분석기술을 확장할 수 있다. 현직 의사인 저자는 임
상연구 자료를 분석하면서 기존에 분석도구로 사용하던 SPSS에 한계를 느끼게 되었고 이후 인터넷을 통해 R을 접하
면서 데이터 분석의 새로운 세계를 경험하게 되었다고 말한다. 무엇보다 작업속도가 크게 향상되었고, 효율적으로
일하는 습관을 만드는 데 큰 도움이 되었다고 한다. 이에 자신이 경험한 R 데이터 분석의 효용을 많은 이들과 나누
고자 이 책을 집필하게 되었다.
물론 R은 GUI 방식의 SPSS와 달리 코드를 한 줄 한 줄 입력해야 하고 함수와 명령어에 익숙해져야 분석을 수행할
수 있다. R의 러닝커브는 완만해서 능숙히 사용하기까지 비교적 오랜 시간이 필요하다. 이 책은 R 데이터 분석의
이러한 어려움을 누구보다 잘 아는 저자가 여러 가지 시행착오를 겪으며 자신이 습득한 R 분석의 핵심 내용을 정리
한 책이다. 책은 총 9개의 장으로 구성되어 있다. 1장에서 5장까지는 R을 이용해 기본 데이터를 다루고 시각화하는
방법을 상세히 다룬다. 6장에서는 임상연구 데이터 분석을 위한 의학통계 지식을 다룬다. 임상연구 및 논문 작성에
많이 사용되는 통계분석 방법(회귀분석, 일반화 선형분석, ROC 관련 분석, 생존분석 등)에 대해 설명한다. 7장에서
9장까지는 실제 발표된 임상연구를 바탕으로 분석 계획을 세우고, 데이터 구조를 파악/전처리한 뒤 그에 적합한 분
석방법을 택해 분석을 수행하는 전 과정을 체계적으로 다룬다.
이 책의 목표는 독자들에게 R을 보다 효과적으로, 빠른 시간 내에 익히고 실무에서 활용할 수 있도록 안내하는 것
이다. 이에 기본적 원론적 내용은 줄이고, 연구자들에게 실질적 도움을 줄 수 있는 R의 유용한 기능들을 소개하고
최대한 현실을 반영하는 임상데이터를 이용하여 실습을 수행하였다. 아울러 R의 다양한 기능과 문법에 대해서는 실
습 중간중간 설명 및 예제를 최대한 담아 독자들의 이해를 돕고자 하였다.
주요 특징
▪ 데이터 분석 도구로서 R 프로그램의 뛰어난 효용(빠른 작업속도, 뛰어난 재현성,
우수한 시각화 등)을 담아낸 책
▪ 원론적 내용은 줄이고, R 데이터 분석의 핵심 내용을 체계적으로 정리한 책
▪ 임상의학 연구자, 보건의료 분야 연구자, 보다 쉽고 빠르게 R 데이터 분석에
입문하기 원하는 연구자들을 위한 필독서 !
▪ 임상연구 자료분석에 특화돤 R 데이터 분석서
▪ 풍부한 임상데이터를 활용한 실제적 분석서
Ch 1 R 시작하기
1 임상연구 및 빅데이터 사용에 유용한 R
2 R 및 RStudio 설치하기
3 RStudio 구성, 환경설정
4 R 필수 개념 이해
5 데이터 인덱싱과 슬라이싱
6 예제 데이터 다운로드 및 저장
7 패키지
8 R 나도 할 수 있다 !
Ch 2 데이터 분석의 시작
1 프로젝트 기반으로 시작하기
2 데이터 불러오기
3 데이터 훑어보기
4 데이터 인덱싱, 슬라이싱
5 factor 다루기
6 기술통계
7 데이터 수정 및 결측치
8 apply 함수
9 if, for 함수
10 중복 결과값 다루기
11 Table 1 만들기
Ch 3 데이터 핸들링
1 tidyverse
2 select
3 filter
4 mutate
5 arrange
6 summarise
7 group_by
Ch 4 데이터 분리와 합치기
1 merge
2 tidyverse를 이용한 merge
3 tidy 데이터
Ch 5 데이터 시각화
1 R base 그래프
2 ggplot2 패키지
3 ggplot2의 다양한 옵션
4 ggpubr 패키지
5 상관관계를 그려주는 패키지
Ch 6 임상연구 관련 의학통계
1 회귀분석
2 일반화 선형분석
3 ROC 관련 분석
4 생존분석
5 시간의존 콕스 비례위험모형
Ch 7 연구 따라하기 1: 아스피린과 간담도암
1 연구 배경 및 개요
2 분석 계획
3 데이터 분석
4 단변량 분석
5 다변량 분석
6 결과 제시
Ch 8 연구 따라하기 2: 생체표지자와 간암
1 연구 배경 및 개요
2 분석 계획
3 데이터 분석
4 ROC 곡선
5 Cut-Off
Ch 9 연구 따라하기 3 : ALT 정상화와 간암 발생 위험
1 연구 배경 및 개요
2 분석 계획
3 데이터 전처리 및 탐색
4 데이터 분석: 기저특성 요약
5 데이터 분석: 간암 발생
6 데이터 분석: ALT 정상화
7 데이터 분석: 간암 발생의 위험인자 찾기
8 데이터 분석: 하위그룹 분석
하나의 테이블로 제시하기