선형회귀분석에 대해 알아보았다.
선형회귀분석은 간단히 말하면 "빠진 값 찾기"의 한 방법론이다.
미래를 예측하는 것은 일단 선형이든, 지수함수이든, 로지스틱이든, 충분한 연구를 근거로 알맞은 형태를 찾은 다음에야 가능하다.
이미 측정한 범위 내에서 선형이라고 가정하고 그 선분을 추정한다.
그러면 그게 측정한 범위 내에서의 추정값이 되는데
예를 들어 어떤 나무가 자라는 과정을 4일 동안 비연속적으로 관찰한다고 해보자.
1일차 12시에는 0.51m, 2일차 12시에는 1.05m, 3일차 12시에는 1.53m, 4일차 12시에는 1.98m로 측정되었다고하면
2일차 18시에는 얼마 정도 자라 있었을까?
구글에 linear regression calculator를 치고 대신 계산해주는 사이트를 이용해서 , 1일차 12시를 t = 1, 4일차 12시를 t = 4로 놓고 높이를 h로 하면 h = 0.489t + 0.005로 추정한다.
여기에 t = 2.25를 대입하면 2일차 18시에는 1.15m인 것으로 추정할 수 있다.
처음 접했을땐 너무 복잡하고 어려웠지만 알면알수록 신기했다.