본문 바로가기

Machine-Learning51

[ML] 회귀 (Regression) 평가 지표 성능 측정 (performance measure) 학습기의 일반화 성능에 대해 평가할 때 유효하고 실험 가능한 테스트 방법뿐만 아니라 모델의 일반화 성능을 평가할 기준이 있어야 한다. 이를 성능 측정 (performance measure)이라고 한다. 성능 측정은 프로젝트 목적을 반영해야 한다. 서로 다른 모델의 성능을 비교할 때 일괄되지 않은 성능 측도를 사용한다면 판단이 힘들 것이다. 이 모델의 '좋음'과 '나쁨'이 상대적이라는 것을 뜻한다. 어떤 모델이 좋은 모델인지 결정하는 것은 알고리즘과 데이터가 아닌 데이터 분석 목적에 달렸다는 것이다 회귀 (Regression)의 평가 지표 회귀의 평가를 위한 지표는 실제 값과 회귀 예측 값의 차이를 기반으로 평가한다. 아래는 회귀 평가를 사용할 때 자주 사.. 2021. 9. 5.
[ML] 분류 (Classification) 회귀와 분류 차이 머신러닝을 통해 해결하려는 문제의 종류에 따라 나눌 수 있는데, 우리가 예측하려는 값의 종류에 따라 회귀와 분류로 구분할 수 있다 값의 종류로는 연속 값(continous value)과 이산 값(discrete value)으로 나눌 수 있다 연속(continuous) 값이란, 말 그대로 연속하는 값을 말한다. 주관신 문제의 답을 쓰듯이, 그값은 0.3이 될 수도 있고 0.31, 0.301, 0.3001 이렇게 끝없이 연속되어 나갈 수 있다. 예를 들면 신장, 체중 등을 의미한다. 이산(Discrete) 값이란, 객관식 문제의 보기처럼 한정된 수로 끊어져 있다. 예를 들면 다음과 같이 "10대/ 20대/ 30대/ 40대/ 50대/ 60대 이상", "e-mail이 스팸인지 아닌지", "어떤.. 2021. 9. 5.
[ML] Logistic Regression 로지스틱 회귀 (Logistic Regression) 만약 우리가 해결해야 하는 문제가 분류 문제라면 어떻게 해야 할까? 답은 선형 모델에 있다. 단조 미분 가능 함수 하나만 찾아내어 분류 문제의 실제 레이블 y와 선형 회귀 모델의 예측 값을 연결해 주기만 하면 된다. 결괏값이 \(y \in {{0, 1}}\) 인 이진 분류 문제를 생각해 보자 선형 회귀 모델이 생성한 예측 값 \( z= w^Tx + b \)는 실수 이다. 따라서 실수 \(z\) 를 0/1값으로 변환해 줘야 한다. 이때, 가장 이상적인 방법은 단위 계단 함수 (unit-step function)을 활용하는 것이다 $$ \left\{\begin{matrix} 0, & z 0; \\ \end{matrix}\right. $$ 만약 예측값 z가.. 2021. 3. 17.
[ML] 회귀(Regression) 회귀(regression)란 무엇일까? 회귀(regression)는 현대 통계학을 떠받치고 있는 주요 기둥 중 하나이다. 회귀 기반의 분석은 엔지니어링, 의학, 사회과학, 경제학 등의 분야가 발전하는데 크게 기여해왔다. 회귀 분석은 유전적 특성을 연구하던 영국의 통계학자 갈톤 (Galton)이 수행한 연구에서 유래했다는 것이 일반론이다. 갈톤은 부모와 자식 간의 키의 상관 관계를 분석했고, 부모의 키가 모두 클 때 자식의 키가 크긴 하지만 그렇다고 부모를 능가할 정도로 크지 않다고, 부모의 키가 모두 아우 작을 때 그 자식의 키가 작기는 하지만 부모보다는 큰 경향을 발견했다. 부모의 키가 아주 크더라도 자식의 키가 부모보다 더 커서 세대를 이어가면서 무한정 커지는 것이 아니며, 부모의 키가 아주 크더라도.. 2021. 3. 15.
[ML] 퍼셉트론과 인공신경망 생물학적 뉴런과 퍼셉트론 생물학적으로 신경 세포인 뉴런은 여러 개의 수상 돌기 (Denrites)로부터 서로 다른 세기의 전기적인 신호를 받고 이 신호 세기의 합이 정해진 임계값을 넘으면 시냅스(Synapse)를 통해 출력 신호를 보낸다. 이 출력은 또 다른 뉴런으로 연결되어 같은 과정을 반복하는 것이다. 인간의 신경망은 수 많은 뉴런들이 연결되어 뇌로 정보를 전달하는 구조를 지닌다. 딥러닝은 인간의 신견망을 모사하여 만든 인공 신경망 (Artificial Neural Network)을 기반으로 학습하는 방법이다. 인공 신경망은 노드와 가중치가 연결된 구조로써 노드 (Node)는 뉴런에 해당하고 가중치 (Weight)는 시냅스에 대응하는 개념이다. 이때 노드에 있는 값과 시냅스에서 나오는 가중치가 선형 .. 2021. 3. 4.
[ML] 인공지능(AI) 개요 인공 지능의 역사 인공 신경망은 2016년 3월 이세돌 9단과 인공지능 알파고(Alpha Go) 의 바둑 대결을 통해 매우 유명해졌지만, 사실 인공 신경망은 이전에도 계속 연구되던 분야이다. 인공 신경망은 1957년 코넬 항공 연구소의 Frank Rosenblatt가 패턴 인식을 위해 고안한 퍼셉트론 알고리즘(Perceptron Algorithm)을 시작으로 인공 신경망에 대한 기대가 매우 컸다. 하지만 1969년 Minskey 교수의 XOR 문제 제기로 인해 당시 인공지능의 한계를 드러냈다. 이를 해결하기 위해서 1974년 Paul Werbos는 역전파 (Backpropagation)를 제안했지만 이목을 끌지 못했다. 시간이 흘러 현재 AI 거장 중 한명인 제프리 힌튼(Geoffrey Hinton)은 .. 2019. 12. 5.