기계학습 8

Machine Learning (기계학습) - part 10 [앙상블(Ensemble),부스팅(Boosting)]

2021년도에 대학교 과목으로 들었던 '기계학습' 강의를 복습 및 정리 + 추가적인 공부를 위해 이 글을 작성한다. (세종대학교 최유경 교수님 '2021 기계학습'수업) 이번 파트는 머신러닝의 꽃이자 종착역인 앙상블에 대해 알아본다. 사실 앙상블은 여러 의미를 지니고 여러 용도를 가지고 있지만, 여기서는 이전에 배웠던 지도학습의 여러 모델들을 다 같이 사용하거나 하나의 모델을 여러번 사용하여 더 좋은 결과를 얻는 방법에 관한 앙상블에 대해 알아보려 한다. 앙상블(Ensemble) 이론 앙상블이란, 여러 분류기를 하나로 연결하여 개별 분류기보다 더 좋은 일반화(generalization) 성능을 달성하는 것을 이야기한다. 즉, '여러 모델을 함께 사용하자!'의 아이디어인 것이다. 이 앙상블에는 여러 분류 ..

Machine Learning (기계학습) - part 9 [교차 검증, 모델 최적화, 파이프라인]

2021년도에 대학교 과목으로 들었던 '기계학습' 강의를 복습 및 정리 + 추가적인 공부를 위해 이 글을 작성한다. (세종대학교 최유경 교수님 '2021 기계학습'수업) 이번 파트는 지금까지 배운 기계학습(지도학습, 비지도학습)을 실제로 적용할 때 유용하고 또 필요한 기술들에 대해 배우려고 한다. 이 기술에는 교차검증, 파이프라인, 모델 최적화, 최적의 하이퍼 파라미터 찾기 등이 있다. 1. 교차 검증 (Cross Validation) 이론 우리가 지금까지 학습된 모델을 검증했던 과정을 생각해보자. 학습데이터를 통해 우리가 정한 모델을 학습하고 검증데이터를 통해 해당 모델의 최적의 하이퍼파라미터를 선택했으며 마지막으로는 학습이나 검증에 이용한 적이 없는 실제 시험데이터의 정밀도를 측정했다. 이 과정에서 ..

Machine Learning (기계학습) - part 7 [비지도학습 (Unsupervised learning), 군집화(Clustering)]

2021년도에 대학교 과목으로 들었던 '기계학습' 강의를 복습 및 정리 + 추가적인 공부를 위해 이 글을 작성한다. (세종대학교 최유경 교수님 '2021 기계학습'수업) 저번 파트까진 지도학습(Supervised learning)에 대해 배우고 지도학습의 대표적인 학습 모델에 대해서 알아보았다.이번 주차부터는 지도학습과는 다른 비지도학습(Unsupervised learning)에 대해 알아보고 비지도학습의 대표적인 학습 모델을 소개하려 한다. 비지도학습(Unsupervised Learning) 비지도학습은 말 그대로 학습을 지도하는 가이드 라인(결과값)이 없다고 생각하면 된다. 즉, 입력값에 대한 결과값(목표값)이 주어지지 않은 상태에서 데이터가 어떻게 구성되었는지를 중점적으로 학습을 진행한다. 지도학습..

Machine Learning (기계학습) - part 6 [SVM (Support Vector Machine)]

2021년도에 대학교 과목으로 들었던 '기계학습' 강의를 복습 및 정리 + 추가적인 공부를 위해 이 글을 작성한다. (세종대학교 최유경 교수님 '2021 기계학습'수업) 저번 파트에 이어서 이번에도 지도학습의 학습 모델 중 SVM(Support Vector Machine)에 대해 알아본다. SVM은 기본적인 학습 모델들(Logistic Regression, DA, .. )과 같이 예측 모델을 만들고 이 모델의 파라미터를 추정하여 예측을 진행한다. SVM(Support Vector Machine) 이론 SVM은 패턴인식, 자료 분석을 위해 널리 사용되는 지도학습모델이다. 분류와 회귀 두가지 문제에 대해 모두 적용이 가능하지만, 주로 분류 문제에 사용된다. SVM의 기본적인 개념은 두 카테고리 중 어느 하나..

Machine Learning (기계학습) - part 5 [의사결정나무(Decision Tree)]

2021년도에 대학교 과목으로 들었던 '기계학습' 강의를 복습 및 정리 + 추가적인 공부를 위해 이 글을 작성한다. (세종대학교 최유경 교수님 '2021 기계학습'수업) 저번 파트에 이어서 이번에도 지도학습의 학습 모델 중 의사결정나무(Decision Tree)에 대해 알아본다. 의사결정나무(Decision Tree)는 이전 파트에 배웠던 학습 모델들과는 같이 예측 모델을 만들고 이 모델의 파라미터를 추정하여 예측을 진행하지 않고 특정 알고리즘을 통해 학습 및 예측을 진행한다. 의사결정나무같은 경우 최근에 자주 사용되는 다양한 앙상블 머신러닝 기법의 기반이기에 좀 더 확실히 인지하고 갈 필요가 있다. 의사결정나무(Decision Tree) 이론 의사결정나무란 무엇일까? 의사결정나무란 학습 데이터 자체를 ..

Machine Learning (기계학습) - part 3 [로지스틱 회귀(Logistic Regression)]

2021년도에 대학교 과목으로 들었던 '기계학습' 강의를 복습 및 정리 + 추가적인 공부를 위해 이 글을 작성한다. (세종대학교 최유경 교수님 '2021 기계학습'수업) 저번 part에 이어서 이번에도 지도학습의 학습 모델 중 로지스틱 회귀(Logistic Regression)에 대해 알아본다. 이전에 배웠던 KNN같은 경우 학습 데이터 자체분석하여 예측을 진행하였다. 하지만 로지스틱 회귀 모델은 여타 다른 학습 모델과 같이 예측 모델을 만들고 이 모델의 파라미터를 추정하여 예측을 진행한다. 로지스틱 회귀(Logistic Regression)를 알아보기 전 우린 선형 회귀(Linear Regression)에 대해 알아볼 필요가 있다. 선형회귀는 딥러닝의 핵심인 퍼셉트론의 기반이 되는 모델이기에 추후 다룰..

Machine Learning (기계학습) - part 2 [지도학습, KNN(K-Nearest Neighbor)]

2021년도에 대학교 과목으로 들었던 '기계학습' 강의를 복습 및 정리 + 추가적인 공부를 위해 이 글을 작성한다. (세종대학교 최유경 교수님 '2021 기계학습'수업) 이제 본격적인 기계학습에 대해 알아보자. part1에서 언급했듯이 기계학습에는 지도학습, 비지도학습, 강화학습 3가지로 분류할 수 있다고 했다. 이번 part에서는 지도학습이 무엇인지, 지도학습의 대표적인 학습모델에 대해 알아보자. 지도학습 지도학습은 말 그대로 학습을 지도하는 가이드 라인(결과값)이 있다고 생각하면 된다. 즉, 입력과 결과값(목표값)을 이용하여 학습을 진행한다. 이는 크게 분류(classification)와 회귀(regression)로 나누어진다. 1. 분류(classification) 분류는 미리 정의된, 가능성 있는..

Machine Learning (기계학습) - part 1 [기계학습, 데이터]

2021년도에 대학교 과목으로 들었던 '기계학습' 강의를 복습 및 정리 + 추가적인 공부를 위해 이 글을 작성한다. (세종대학교 최유경 교수님 '2021 기계학습'수업) What is ML? 먼저 Machine Learning 즉, 기계학습이란 무엇일까? 사전적 정의로는 '경험을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구로 인공지능의 한 분야'이다. 즉, 컴퓨터가 알아서 데이터의 패턴 및 분포를 파악하며 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야라고 할 수 있다. 이런 기계학습은 대표적으로 지도학습, 비지도학습, 강화학습 3가지로 분류할 수 있다. 1. 지도학습(Supervised Learning) 지도학습은 말 그대로 학습을 지도하는 가이드 라인(결과값)이 있다고 생각하면 된다. 즉, ..