기타/기계학습
1. 머신러닝 기초
seeyoun
2023. 1. 31. 19:39
◆ 머신러닝은 다양한 산업분야에서 사용되고 있다
1) 웹의 성장과 자동화의 성장 -> 굉장히 많은 데이터 -> 학습에 용이
2) 수동으로 코딩하지 못하는 것들 -> 학습을 통해 알고리즘 만들도록 함
3) 맞춤형 추천해주는 프로그래밍
4) 인간이 어떻게 학습하는지와, 뇌를 이해하기 위해 사용됨
◆ 머신러닝이란?
1) 컴퓨터가 명시적인 프로그램 없이도 스스로 학습할 수 있는 능력을 연구하는 학문
2) 프로그램은 경험(E)으로부터 학습한다. 프로그램이 일정 수준의 성능 측정(P)을 가지고 작업 (T)을 수행한다고 했을 때, 경험(E)이 증가함에 따라 작업(T)을 수행하는 성능(P)이 향상될 수 있다.
◆ 머신러닝의 종류
1) 지도학습
정답이 있는 데이터 set을 통해 학습
2) 비지도학습
정답이 없는 데이터 set을 통해 학습
3) 강화학습
데이터 없이 시행착오를 통해 학습
◆ 지도학습 (Supervised Learning)
정답이 있는 데이터 set을 통해 학습
1) 회귀 (Regression)
연속적인 출력 값을 예측하는 것
ex) 엄청난 재고로 쌓인 똑같은 상품을 3개월 안에 얼마나 팔 수 있을지 예측하는 문제, 집의 가격 변화 예측 문제
2) 분류 (Classification)
이산적인 출력 값을 예측하는 것
ex) 수많은 개별 고객사가 해킹 또는 손상됐는지를 판단하는 문제, 유방암의 유무를 예측하는 문제
◆ 비지도학습 (Unsupervised Learning)
정답이 없는 데이터 set을 통해 학습
1) 군집화 (Clustering)
서로 비슷한 데이터들 끼리 묶어놓는 것
ex) 구글 뉴스는 같은 토픽이나 주제의 기사들을 묶어놓음
2) 변환
3) 연관 (Association)
특성을 그룹핑 해주는 것