SQL
카타
문제 116. 1321. Restaurant Growth : 윈도우 함수-집계 행 지정, limit 활용(offsetX)
with cte as
(select visited_on,
sum(amount) as amount
from customer
group by visited_on)
select visited_on,
sum(amount) over (order by visited_on rows between 6 preceding and CURRENT ROW) as amount,
round(avg(amount*1.00) over (order by visited_on rows between 6 preceding and current row), 2) as average_amount
from cte
order by visited_on
limit 6, 18446744073709551610;
포인트
1. 윈도우 함수 행 지정 익혀 둘 것!
-sum() over (order by ~ rows between ~ preceding and current row)
2. 다른 답안에는 offset이 있는데 왜인지 offset이 사용이 되질 않았다;;
강의 - 회귀분석
선형회귀 이론 :
1. 머신러닝에서의 선형회귀 식
Y = wX + b
w : 가중치
b : 편향(bias)
2. 회귀분석 평가 지표
1. MSE : Mean Squared Error(제곱하고 평균 구한 에러)
-모든 데이터에 대한 에러 값을 각각 제곱해서 전부 더해준 뒤, 이를 데이터 값으로 나눈 것
*주로, 같은 데이터에서 다른 모델과 비교할 때 씀
(다른 데이터 끼리의 MSE 수치로 어떤 것이 더 정확한지 비교하기 애매. 특히 한 데이터의 MSE 값이 키-몸무게와 같이 다른 단위를 기반으로 할 경우!)
2. R-Square 선형회귀만의 평가 지표
-모든 데이터에 대한, '실제 값과 예측 값의 차이(SSE)'와 '예측값과 평균값의 차이(SSR)'를 더한 것(SST)에서 '예측값과 평균값의 차이'를 평균 낸 것
*분야마다 적정 기준 다름 : 사회통계 등등