목록Machine Learning/2. 지도 학습 알고리즘 (27)
My Data Story

◈ '분류' 목차 ◈ 1. 나이브 베이즈 나이브 베이즈 알고리즘을 통한 분류 과정에 대해 살펴보자. 2. 선형판별분석(LDA) 3. 로지스틱 회귀 4. 소프트맥스 회귀 5. 다중 레이블 분류, 다중 출력 분류 6. 분류 모델 평가 데이터 과학자들은 자동으로 어떤 결정을 해야 하는 종류의 문제들을 자주 접한다. 분류 모델은 어떤 카테고리에 속할 지 예측하는 것을 목표로 한다. 모델에 단순히 이진 분류 결과를 할당하기도 하지만, 대부분의 알고리즘은 관심 클래스에 속할 확률 점수(경향)을 반환한다. 분류 모델의 일반적인 접근 방식은 다음과 같다. step1 관심 클래스에 속할 cut-off 확률을 정한다. step2 레코드가 관심 클래스에 속할 확률을 추정한다. step3 추정한 확률이 cut-off 확률 이..

◈ '회귀' 목차 ◈ 1. 선형 회귀 개념 2. 선형 회귀 모델 훈련 3. 선형 회귀 모델 평가 및 모델 선택 4. 선형 회귀로 새로운 데이터 예측 5. 선형 회귀 모델 해석 6. 선형 회귀 가설 검정 : 회귀 진단 7. 비선형 회귀 - 다항 회귀, 스플라인 회귀 8. 규제가 있는 선형 회귀 규제가 있는 선형 모델 릿지 회귀, 라쏘 회귀, 엘라스틱넷에 대해 살펴보자. 더불어 조기종료를 통해 모델을 규제하는 색다른 방법에 대해서도 살펴보자. 1. 규제가 있는 선형 모델 과대 적합을 감소시키는 좋은 방법은 모델을 규제하는 것이다. 다항 회귀 모델에 규제를 가하는 방법은 다항식의 차수를 감소시키는 것이고 선형 회귀 모델에 규제를 가하는 방법은 모델 파라미터(가중치)를 제한하는 것이다. 1.1 릿지 회귀 규제 ..

◈ '회귀' 목차 ◈ 1. 선형 회귀 개념 2. 선형 회귀 모델 훈련 3. 선형 회귀 모델 평가 및 모델 선택 4. 선형 회귀로 새로운 데이터 예측 5. 선형 회귀 모델 해석 6. 선형 회귀 가설 검정 : 회귀 진단 7. 비선형 회귀 - 다항 회귀, 스플라인 회귀 응답 변수와 예측 변수 관계가 비선형일 때 적용할 수 있는 다항회귀, 스플라인회귀, 일반화가법모형에 대해 살펴보자. 8. 규제가 있는 선형 회귀 응답 변수와 예측 변수간의 관계가 반드시 선형일 필요는 없다. 비선형 관계를 띈다면 다항회귀나 스플라인 회귀와 같은 비선형 모델을 고려해볼 수 있다. 어떤 모델이 비선형 회귀 모델일까? 본질적으로 예측 변수들의 선형 결합 또는 일부 변환으로 응답 변수를 표현할 수 없는 모든 모델을 말한다. 통계학자가 ..

◈ '회귀' 목차 ◈ 1. 선형 회귀 개념 2. 선형 회귀 모델 훈련 3. 선형 회귀 모델 평가 및 모델 선택 4. 선형 회귀로 새로운 데이터 예측 5. 선형 회귀 모델 해석 6. 선형 회귀 가설 검정 : 회귀 진단 회귀 모델 생성 후, 선형 모델의 가정에 대해 검정하며 예측 설정에 중요한 통찰을 살펴볼 수 있다. 7. 비선형 회귀 - 다항 회귀, 스플라인 회귀 8. 규제가 있는 선형 회귀 잔차 분석을 기본으로 선형 회귀 모델을 뒷받침하는 가정들을 검정하며 회귀 진단을 해볼 수 있다. 이런 단계는 직접적으로 예측 정확도를 다루는 것은 아니지만, 예측 설정에 중요한 통찰을 줄 수 있다. 1. 특잇값 소위 특잇값이라 부르는 극단값은 대부분 측정치에서 멀리 벗어난 값을 의미한다. 회귀에서 특잇값은 실제 y 값..

◈ '회귀' 목차 ◈ 1. 선형 회귀 개념 2. 선형 회귀 모델 훈련 3. 선형 회귀 모델 평가 및 모델 선택 4. 선형 회귀로 새로운 데이터 예측 5. 선형 회귀 모델 해석 회귀 모델 생성 후, 회귀 방정식에 대해 해석하며 예측 모델에 통찰을 얻을 수 있음을 살펴볼 수 있다. 6. 선형 회귀 가설 검정 : 회귀 진단 7. 비선형 회귀 - 다항 회귀, 스플라인 회귀 8. 규제가 있는 선형 회귀 1. 회귀 방정식 해석 데이터 과학에서 회귀의 가장 중요한 용도는 종속 변수를 예측하는 것이다. 하지만 때로는 예측 변수와 결과 변수간 관계의 본질을 이해하기 위해 방정식 자체로부터 통찰을 얻는 것이 중요할 때도 있다. 회귀 방정식을 검토하고 해석하는 방법에 대해 살펴보자. 1.1 예측 변수 간 상관 예측 변수 간..

◈ '회귀' 목차 ◈ 1. 선형 회귀 개념 2. 선형 회귀 모델 훈련 3. 선형 회귀 모델 평가 및 모델 선택 4. 선형 회귀로 새로운 데이터 예측 회귀 모델 생성 후, 데이터 예측 시 존재하는 예측값의 불확실성에 대해 알아보자. 5. 선형 회귀 모델 해석 6. 선형 회귀 가설 검정 : 회귀 진단 7. 비선형 회귀 - 다항 회귀, 스플라인 회귀 8. 규제가 있는 선형 회귀 1. 회귀 모델의 예측 VS 설명 역사적으로 예측 변수와 결과 변수 사이에 있을 것으로 추정되는 선형관계를 밝히는 것이 회귀 분석의 주된 용도였다. 회귀로 피팅한 데이터를 통해 데이터 간의 관계를 이해하고 그것을 설명하는 것을 목표로 해왔다. 즉 회귀 방정식의 기울기를 추정하는 데 초점이 맞춰졌다. 빅데이터의 출현과 함께 회귀 분석은 ..

◈ '회귀' 목차 ◈ 1. 선형 회귀 개념 2. 선형 회귀 모델 훈련 3. 선형 회귀 모델 평가 및 모델 선택 선형 회귀 모델 평가 지표에 대해 살펴보고, 다중 선형 모델 구현 시 최적의 예측 변수 선택하는 방법에 대해 알아보자. 4. 선형 회귀로 새로운 데이터 예측 5. 선형 회귀 모델 해석 6. 선형 회귀 가설 검정 : 회귀 진단 7. 비선형 회귀 - 다항 회귀, 스플라인 회귀 8. 규제가 있는 선형 회귀 1. 선형 회귀 모델 평가 Average Error sign effect 에 따라 적절하지 않은 결론으로 도달하기 쉬워 절대 사용 안 한다. Mean Absolute Error (MAE) Average Error 에 절댓값을 적용한 지표인데 상대적 차이값을 나타내기 어렵다. Mean Absolute..

◈ '회귀' 목차 ◈ 1. 선형 회귀 개념 2. 선형 회귀 모델 훈련 선형 회귀 모델의 회귀 계수 추정 원리를 알아보고, Jupyter 통해 선형 회귀 모델 훈련시키는 방법에 대해 살펴보자. 3. 선형 회귀 모델 평가 및 모델 선택 4. 선형 회귀로 새로운 데이터 예측 5. 선형 회귀 모델 해석 6. 선형 회귀 가설 검정 : 회귀 진단 7. 비선형 회귀 - 다항 회귀, 스플라인 회귀 8. 규제가 있는 선형 회귀 1. 선형 회귀 모델 훈련시키기 모델을 훈련시킨다는 것은 모델이 훈련 데이터에 가장 잘 맞도록 모델 파라미터를 구하는 것이다. 즉 모델을 훈련시키는 것은 선형 회귀 모델의 각 특성에 대한 회귀 계수와 편향(상수) 을 추정하는 것이다. 1.1 선형 회귀 계수 추정 원리 선형 회귀 계수를 어떻게 구할..

◈ '회귀' 목차 ◈ 1. 선형 회귀 개념 선형 회귀 종류에 대해 살펴보고 선형 회귀 모형에 대한 통계적 가정을 살펴보자. 2. 선형 회귀 계수 모델 훈련 3. 선형 회귀 모델 평가 및 모델 선택 4. 선형 회귀로 새로운 데이터 예측 5. 선형 회귀 모델 해석 6. 선형 회귀 가설 검정 : 회귀 진단 7. 비선형 회귀 - 다항 회귀, 스플라인 회귀 8. 규제가 있는 선형 회귀 1. 선형 회귀 선형 회귀 모델은 예측 변수X와 응답 변수 Y의 크기 사이에 어떤 관계가 있는 지 선형함수로 모델링한다. 상관관계도 두 변수가 서로 어떤 관계인지를 보여주는 방법 중 하나이지만 상관관계는 두 변수 사이의 전체적인 관련 강도를 측정하는 것이라면, 회귀는 관계 자체를 정량화하는 방법이다. 선형 회귀 모델은 입력 특성의 ..