선형 회귀(Linear Regression)

Linear -> 선을 그려

Regression -> 값을 예측

회귀(Regression)는 통계학과 머신러닝에서 사용되는 용어로, 어떤 변수의 값을 다른 변수의 값으로 예측하거나 설명하는 모델

y = ax+b

가증합으로 새로운 특성을 만들어낸다

로지스틱 회귀분석(logistic regression)

input과 weight를 곱해서 더하는 과정은 linear combination(선형 결합)이다.
인공신경망의 학습은 각 뉴런에 곱해지는 ‘weight’라는 모수(parameter)를 추정(estimate)하는 과정이다

로지스틱 회귀분석은 generalized linear model(GLM)의 일종이다

로지스틱 함수가 바로 우리가 활성함수로 사용하는 sigmoid function이다

Sigmoid를 활성함수로 사용하는 multi layer perceptron neural network의 hidden layer의 각 뉴런은 로지스틱 회귀분석을 하는 것과 정확히 일치

예측값들과 정답이 대처로 멀리 떨어져 있으면 결과의 편향(bias)이 높다고 말하고
예측값들이 자기들끼리 대체로 멀리 흩어져 있으면 결과의 분산(variance)이 높다고 말한다.

표에서 변수는 열

한쪽의 값이 바뀌었을 때, 다른 쪽의 값도 바뀐다면,
두 개의 특성은 ‘서로 관련이 있다’고 추측할 수 있습니다.
그리고, 이런 관계를 ‘상관관계’라고 합니다.

각 열이 원인과 결과의 관계일 때
인과관계가 있다고 합니다.

결과가 숫자가 아니라 손톱, 정상과 같은 이름이면 분류(Classification)를 사용한다

예측하고 싶은 종속변수가 숫자일 때 회귀(Regression)를 사용한다

군집 (Clustering)
- 비슷한 것들끼리 모아서 적당한 그룹을 만들 것입니다 이렇게 그룹을 만드는 것이 군집
- 좌표 평면을 사용하면 군집을 쉽게 볼 수 있습니다
연관 규칙 학습(Association Rule Learning)
- 어떤 물건을 살 때 다른 물건도 같이 살 확률이 높다면, 그 물건들은 연관이 있다고 볼 수 있습니다
- 이런 연관을 찾는 것이 연관 규칙 학습