인공지능, 머신러닝, 딥러닝의 차이
뉴스나 기사 등에서는 딥러닝, 머신러닝, 인공지능 등을 혼용해서 사용하지만, 저 세 단어는 각각 다른 것들을 지칭한다.
-
인공지능
-
사람이 인위적으로 만든 지능
-
가장 흔히 사용되는 단어로, 우리가 흔히 생각하는 의미와 같다.
-
머신러닝, 딥러닝을 포함하는 가장 넓은 의미의 단어다.
-
-
머신러닝
-
머신러닝은 인공지능을 만들기 위한 기술이다.
-
크게 지도학습과 비지도학습, 강화 학습으로 나눌 수 있다.
-
-
딥러닝
-
머신러닝의 일종이다.
-
지도학습에 포함된다.
-
머신러닝
머신러닝은 인공지능을 만드는 기술로, 학습데이터를 학습하여 인공지능을 만든다.
이해를 위해 조악한 비유를 하자면, 머신러닝은 프로그래밍에서의 함수와 비슷하다.학습데이터를 입력받아 모델을 출력한다.머신러닝을 통해 얻은 모델에 입력데이터를 입력하면 모델이 결과를 출력한다.
예를 들어 강아지와 고양이를 분류하는 인공지능을 만든다고 하자. 학습데이터로 다양한 고양이 사진과 강아지 사진을 제공하면, 머신러닝을 통해 모델이 개발된다. 이 모델이 제대로 작동하는지 확인하기 위해, 강아지 사진 (혹은 고양이 사진)을 입력데이터로 입력한다. 이 때, 입력데이터는 학습데이터와는 다른 데이터다. 입력데이터를 받은 모델은 이 사진이 강아지인지, 고양이인지 분류한다. 비록 예시지만 우리는 방금 머신러닝을 통해 강아지와 고양이를 분류하는 인공지능을 만들었다!
-
일반화
-
학습데이터와 입력데이터에 따른 성능 차이가 나지 않는 것
-
성능 차이가 나지 않는 경우, ‘일반화’를 잘했다고 한다.
-
-
과적합
-
비정상적인 데이터까지 학습하면서 모델의 일반화 성능이 떨어지는 것
-
예를 들어, 키가 190 이상인 청소년들이 과반수인 학습데이터로 학습된 모델은 키 190 이상이 청소년일 확률이 크다고 할 것이다.
-
-
정칙화
-
모델의 형태를 최대한 간단히 만들려는 수치해석적인 기법
-
모델의 성능이 다소 떨어지더라도 과적합에 빠지지 않게 하기 위해 사용한다.
-
-
검증
-
학습데이터의 일부를 떼서 입력데이터로 넣어 모델의 성능 검증을 위해 사용하는 기법
-
학습데이터에서 제외된 데이터는 학습하지 않는다.
-
교차검증
-
학습데이터에서 검증용 데이터를 지속적으로 교체하여 학습하는 기법
-
예를 들어 학습데이터가 10개가 있다면, 첫 번째 학습에서는 학습데이터 1번과 2번을 검증용 데이터로 제외하고, 두 번째 학습에서는 학습데이터 1번과 3번을 검증용 데이터로 제외하는 식
-
-
-
분류
-
입력데이터가 어떤 범주에 속하는지를 분류하는 문제
-
숫자 인식 등의 문제
-
-
회귀
- 입력데이터에 따라 어떤 값을 가질지를 예측하는 문제