반응형 IT관련7 R을 활용한 당뇨병 데이터 분류 분석 R을 활용한 당뇨병 데이터 분류 분석 [ 목차 ] 데이터 소개 및 탐색적 분석 데이터 전처리 모델링 및 성능 평가 모델 성능 비교 시각화 결론 및 제안사항 분석 결과의 시사점 보고서는 Kaggle에 제공된 "Pima Indians Diabetes Database" 데이터를 사용하여, 당뇨병 여부를 정확히 예측하는 최적의 분류 모델을 찾기 위한 분석을 수행합니다. 또한 시각화 기법을 활용하여 데이터 특성을 시각적으로 이해하고자 합니다. 데이터 소개 및 탐색적 분석- 데이터 출처캐글(Kaggle): Pima Indians Diabetes Database 캐글(diabetes) 바로가기 - 데이터 구성변수명설명데이터 타입Preg.. 2025. 4. 16. 수면 시간과 스트레스가 수면의 질에 어떤 영향을 줄까? ( + R 회귀분석 ) 수면 시간과 스트레스가 수면의 질에 어떤 영향을 줄까? [ 목차 ] 프로젝트 개요 사용한 데이터 R코드 분석 분석 결과 요약 시사점 및 마무리 1. 프로젝트 개요 요즘 사람들, 다들 잠 잘 자고 계신가요?수면은 하루의 피로를 풀어주는 중요한 시간인데요. 그런데 수면 시간이 충분해도, 또는 스트레스가 많을 때, 수면의 질은 과연 어떻게 변할까요?이번 포스팅에서는 Kaggle에서 제공하는 수면 건강 데이터를 기반으로수면 시간과 스트레스 수준이 수면의 질(Quality of Sleep)에 어떤 영향을 미치는지 R로 회귀분석을 통해 알아보겠습니다. 2. 사용한 데이터 출처: Kaggle - Sleep Health and Lifestyle Datas.. 2025. 4. 9. 중선형 회귀모델 , 교육, 평판, 여성 비율로 알아보는 연봉 예측 모델 ( +R코드 ) 중선형 회귀모델로 알아본 연봉 예측 모델[ 목차 ] 사용한 데이터는 중선형 회귀분석 예측 예시 변수별 시각화 요약 성별 격차 분석 결론 어떤 직업이 연봉이 높을까요?교육 수준, 직업 평판, 성별 비율 같은 요소들이 연봉에 어떤 영향을 줄까요?오늘은 간단한 통계 모델을 이용해 직업 데이터(Prestige.csv)를 기반으로 연봉을 예측하고, 성별 격차까지 분석하여 데이터로 들여다보는 사회구조와 성별 격차에 대해 알아보겠습니다. 🧾 사용한 데이터는?Prestige.csv라는 공개 데이터를 사용했습니다.education: 평균 교육 연수prestige: 직업의 사회적 평판 점수women: 여성 종사자 비율 (%)income: 평균 연봉.. 2025. 4. 7. R로 회귀 모델 만들기 : cars 주행 속도와 제동 거리 R로 회귀 모델 만들기 : 주행 속도와 제동 거리 [ 목차 ] 데이터 확인 산점도 그리기 선형회귀모델 예측하기 회귀선 그리기 마무리 R의 내장 데이터셋인 cars를 활용해 속도(speed)와 제동 거리(dist) 사이의 관계를 분석해 봅시다. 1. 데이터 확인첫 번째 단계는 데이터의 구조를 살펴보는 것입니다. cars는 R에 기본으로 내장된 데이터셋으로, 두 개의 열로 구성되어 있습니다.speed: 자동차의 속도 (단위: mph)dist: 해당 속도에서 정지하기까지의 제동 거리 (단위: ft)이 데이터를 통해 우리는 속도와 제동거리 사이에 어떤 관계가 있는지 분석하게 됩니다. 2. 산점도 그리기 산점도(Scatter plot)는 두.. 2025. 4. 3. GDP로 보는 대한민국의 변화 – 경제성장, 출산율, 기대수명의 상관관계( + R코드) GDP로 보는 대한민국의 변화-– 경제성장, 출산율, 기대수명의 상관관계 [ 목차 ] 데이터요약 경제성장과 삶의 질 경제성장과 출산율 감소경제성장과 출산율 감소 10년 단위로 본 경제성장 속도GDP와 사회지표 분석을 통한 시사점 대한민국은 어떻게 성장해왔을까요?1950년대 전쟁의 폐허 속에서 시작된 대한민국의 경제는 지금 어디까지 와 있을까요?GDP(국내총생산)과 1인당 GDP, 그리고 출산율, 기대수명 같은 사회지표를 함께 분석해보면, 우리가 지나온 길을 보다 입체적으로 볼 수 있습니다.오늘은 국가통계포털(KOSIS)의 데이터를 바탕으로 R을 활용한 간단한 데이터 분석을 통해 대한민국의 경제 및 사회 지표 변화 흐름을 정리해보았습니다. 📊 데이터 요약: 1953년부터 2023년까지분석에 사용.. 2025. 4. 2. 국내 인구동향 변화 분석 (1970~2023) ( + R코드 ) 국내 인구동향 변화 분석 (1970~2023) [ 목차 ] 데이터 수집 및 읽어오기 데이터 전처리 및 파악 주요 통계 요약 상관관계 분석 시각화 결과 결론 및 시사점 오늘은 통계청(KOSIS)에서 제공하는 데이터를 바탕으로 우리나라 인구 구조의 변화를 살펴보려 합니다. 출산율, 사망률, 혼인건수, 기대수명 등의 항목을 분석하여 인구동향의 흐름을 한눈에 이해할 수 있도록 정리해 보았습니다. 📁 데이터 수집 및 구성 이번 분석은 통계청(KOSIS)에서 제공하는 인구동향 데이터를 활용했습니다. 주요 항목은 다음과 같습니다:연도 (year)조사망률 (cdr)합계출산율 (tfr)혼인건수 (marn)기대수명 (life_expec)데이터는.. 2025. 4. 1. 이전 1 2 다음