본문 바로가기

인공지능/이론

(20)
(4) 정밀도/재현율 분류기에는 여러가지 평가 방법이 존재합니다. 가장 대표적으로는 정확도로 평가하는 방법이 존재합니다. 하지만 항상 정확도로 평가하는 것이 좋은 평가방법이 되지는 않습니다. 다음과 같이 비율이 조금 편향된 데이터로 학습한다고 예를 들어보겠습니다. 암 검진 결과 10000개의 훈련사례가 주어진다고 해봅시다. 9500개는 음성이고, 500개가 양성이라면 분류기가 전부 음성이라고 판단했을 때에도 정확도가 95%입니다. 그렇기 때문에 우리는 다른 평가방법을 사용해야 하고, 정밀도와 재현율이라는 것이 존재합니다. 그 전에 먼저 알아야 하는 것들이 있습니다. 오차 행렬이라는 것인데, confusion matrix라고도 불려집니다. TP, TN, FP, FN 이렇게 네개의 용어를 알고 가야합니다. TP는 True Pos..
(3) 사례기반학습과 모델기반학습 머신러닝은 학습 방법에 따라 크게 두가지로 나눌 수 있습니다. 사례기반학습과 모델기반학습이 존재합니다. 사례기반학습은 주어진 input에 대해 학습한 데이터셋에서 유사도를 측정하고 label을 예측하는 방법을 얘기한다. 모델기반학습은 데이터셋에 대해 모델을 만들고, input을 모델로 예측하는 방법을 얘기한다.
(2) 지도학습과 비지도학습 머신러닝은 데이터셋의 종류로 크게 두가지로 나눌 수 있습니다. 지도학습과 비지도학습입니다. 지도학습은 학습데이터에 레이블이 포함된 데이터셋으로 학습하는 방식이고, 비지도학습은 학습데이터에 레이블이 포함되지 않은 데이터셋으로 학습하는 방식입니다. 그 전 글에서의 사과 분류를 예로 들어보겠습니다. 사과 이미지의 픽셀 데이터와 함께 '사과' 또는 'apple'과 같은 레이블을 포함하여 모델을 학습시킨다면 지도학습을 하는 것입니다. 모델은 사과를 학습하고, 사과와 비슷한 특징을 가지고 있는 이미지를 본다면 '사과'라고 예측을 할 것입니다. 하지만 사과 이미지와 바나나 이미지를 데이터셋으로 사용하되, 레이블이 포함되어있지 않은 데이터셋으로 모델을 학습시킨다면 비지도 학습을 하는 것입니다. 사과 이미지와 바나나 이..
(1) 머신러닝이란? 인공지능 - 이론 카테고리에서는 머신러닝 딥러닝에 대한 기초적 이론들을 다루고 있습니다. 이번 글에서는 머신러닝에 대한 정의에 대해 정리하였습니다. 1. 머신러닝이란? - 데이터를 사용하여 자동으로 성능을 향상하는 알고리즘을 연구하는 학문입니다. 쉽게 설명하자면, 사과를 분류하는 문제가 있다고 생각해봅시다. 원시적인 프로그래밍 방법을 사용해 인간이 사과를 분류한다고 한다면 굉장히 복잡한 계산들을 통해 분류를 해낼 수 있을 것입니다. 만약 분류해야 하는 과일이 100개가 넘는다고 하면 알고리즘을 개발해야 하는 개발자는 매일 밤 야근에 시달릴 것입니다. (그렇게 해도 성공적인 분류 작업을 해낼 수 있을지는... ) 하지만 머신러닝은, 이 문제를 보다 유동적으로 해결해줍니다. 사과 이미지를 5000개 준비하고..