반응형

선형회귀 3

머신러닝 분류 알고리즘 종류별 장단점 정리

머신러닝에서 대표적으로 사용되는 분류(Classification) 알고리즘들에 대하여 종류별로 장단점을 간략하게 정리해보도록 하겠습니다. 1. 의사결정나무(Decision Tree) 장점 1. 결과가 나온 과정을 쉽게 추적할 수 있어 설명 가능성이 높다. 2. 정규화 과정이 필요 없고, 데이터의 분포에 상관 없이 적용 가능하다. 3. 범주형, 연속형, 이산형 변수 모두를 다룰 수 있다. 단점 1. 과적합에 매우 취약하여 가지치기가 중요하다. 2. 시계열 데이터나 고차원 데이터에는 적용하기 어렵다. 3. 경계값 근처에서 오류가 발생하기 쉽다. 2. 랜덤포레스트(Random Forest) 장점 1. 의사결정나무의 2, 3번 장점을 그대로 가져갈 수 있다. 2. 의사결정나무의 과적합 문제를 보완할 수 있다. ..

[Matplotlib] 파이썬 회귀선 그리기, 결정계수(R2) 구하고 그래프에 표시하기

파이썬 plt 회귀선 그래프 및 결정계수 텍스트 예제 파이썬에서 선형 회귀 추세선의 식을 구하여 그래프를 그려보고, 결정계수 값을 구하여 그래프 내에 텍스트를 표시하는 예시에 대해서 다루어보겠습니다. 먼저, 아래와 같은 간단한 데이터로 그려진 산점도가 있다고 가정하겠습니다. import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5, 6, 7] y = [2, 6, 5, 8, 9, 13, 12] plt.scatter(x, y, color = 'r', s = 20) plt.xlabel('x') plt.ylabel('y') plt.show() 선형 회귀식 구하기 선형 회귀식을 구하기 위하여 넘파이 라이브러리의 np.polyfit 함수를 사용하겠습니다. x축, y축에 해당하는 데..

Python/Matplotlib 2022.03.29

[Sklearn] 파이썬으로 선형 회귀 분석하기 예제 (Linear Regression)

이번 포스팅에서는 파이썬 사이킷런 모듈로 선형 회귀 분석을 진행하는 방법에 대하여 간단히 다루어보도록 하겠습니다. 우선, 데이터셋으로는 kaggle의 Bike Sharing Demand 학습 데이터셋을 사용하였습니다. 데이터셋의 생김새는 다음과 같습니다. 여기서는 'season', 'holiday', 'weather', 'temp', 'humidity', 'windspeed' 6개의 정보로 해당 시간대의 자전거 대여수인 'count'를 회귀 모델로 예측하는 선형 회귀 모델을 세운다고 가정해보겠습니다. (숫자 feature만 이용이 가능하며, 아닌 경우 이용하기를 원할 때는 one-hot encoding 등 전처리가 필요합니다.) 파이썬 사이킷런 선형 회귀 모델 분석 과정 우선, 먼저 학습에 사용할 fea..

Python/Sklearn 2021.11.23
반응형