머신러닝
-
[DACON] 중고차 가격 예측 경진대회 (2)Study/Data Analysis 2022. 7. 10. 18:15
코랩에서 한 번에 긁어오는 법을 알았다! 4. 모델링 4-1. 변수 정의 해당 데이터 분석의 목적은 주어진 중고차 상세 정보 데이터를 이용하여 target 변수인 자동차 가격을 예측하는 것입니다. 이를 바탕으로 독립변수 X는 중고차 상세 정보 데이터, 종속변수 y는 중고차 가격인 target 변수가 될 것입니다. X = train.drop(['id', 'target'], axis = 1) #training 데이터에서 피쳐 추출 y = train.target #training 데이터에서 중고차 가격 추출 기본적인 인덱스를 의미하는 id 칼럼과 종속변수가 될 target 변수를 제외한 나머지 데이터를 독립변수 X로 설정하였습니다. 그리고 중고차 가격인 target 칼럼만 추출하여 종속변수로 설정하였습니다. ..
-
[DACON] 중고차 가격 예측 경진대회 (1)Study/Data Analysis 2022. 7. 6. 18:48
데이콘의 중고차 가격 예측 경진대회에 참가한 파이썬 코드 목표 설정 : XGBoost를 이용하여 데이터 분석 및 중고차 가격 예측을 진행한다. - 데이콘에 기본적으로 제시된 EDA, Baseline 코드를 활용하여 결측치 제거 및 데이터 전처리를 하고, XGBoost라는 Boosting 앙상블 기법을 이용하여 모델링, 튜닝 및 데이터 예측을 한다. - XGBoost 알고리즘을 사용해보고 하이퍼파라미터를 조정하여 정확도를 높이는 작업 경험이 목표였다. 1. 데이터 불러오기 우선, 데이터를 분석하기 위하여 주어진 train 데이터셋과 test 데이터셋을 읽어와 저장하고, 데이터 구조를 확인합니다. import pandas as pd ## pandas 라이브러리를 가져오기 위하여 import를 해줍니다. # ..