레벨업

[사회조사분석사 2급 실기] 작업형9.회귀분석

우와우앙 2022. 6. 28.
728x90
반응형

 

 

 

회귀분석은 정말 다양하지만 사조사2급에서는 선형회귀분석을 주로 다룬다.

독립 : 연속성, 명목척도(0,1) 

대부분 척도변수..

 

종속변수 : 무조건 연속변수 (척도변수)

 

*방법 : 입력

독립변수 : 4개의 척도변수 

종속변수 : 1개의 척도변수 

넣어줬음.

 

4개의 값/표가 나옴.

 

모형은 하나.

R 다중상관계수 =0.873 (+-1의 관계를 가지고 가까울수록 관계도가 높음)

R^ 결정계수 =다중상관계수의 제곱 = 76.2% 회귀식은 모든 종속변수의 변동량을 76.2%설명함.

수정된 R^ = 결정계수보다 보통 작아짐. 모형이 하나 뿐이라 특별한 의미 있는지 해석하기는 어렵다. 다른 모형이 있는데 수정된 결정계수가 더 높다면 그 모형이 더 바람직하다고 볼 수 있음.

 

분산분석표

회귀식의 전체의 적합성 검정 (F분포)

 - 유의확률이 0.000으로 제시는 되어있지 않지만 유의수준 0.05(5%)보다 작음으로 귀무가설이 기각함.

 - H0: 모든 기울기는 0 

 - H1: 적어도 어느 하나의 베타(기울기)는 0이 아니다.

* 회귀식은 유의미하며 적어도 어느하나의 베타 기울기는 0이 아니다. (적합함)

-> (결론) 독립변수가 종속변수를 설명하는데 적합하다.

다중회귀분석 (T분포)

 

Y국어성적= 1.709상수 -0.423학업만족도+2.309연산서적+1.523도형성적+0.798측정성적

 

표준화계수 베타 :의 절대값이 가장 큰 숫자가 종속변수에 가장 큰 영향을 미치는 변수로 여기서는 절대값이 가장큰 0.606이 나온 연산 성적이 종속변수에 가장 큰 영향을 끼치는 변수이다.

 

상수, 학업만족도는 유의확률 0.05보다 큼 = 귀무가설 기각하지 않음

연산, 도형, 측정 성적은 유의확률 0.05보다 작음 = 귀무가설 기각함 -> 회귀식 유의미한 베타값을 가짐.

 


 

단계적 모형의 선택

단계선택 방법 , 

옵션에서 F확률 사용(진입, 제거 값은 수정하라고 할 수 도 있음)

모형을 세개 돌렸다는 의미로, 영향력이 큰 것부터 진입한다는 의미이다.

측정 > 연산> 도형성적 순서로 집어넣었다는 말임.

4개의 변수를 입력했는데 단계적 선택을 하니 모형이 3개밖에 안나옴.

4개중에 3개를 선택하는 것이 좋은 모형을 만드는 것이 가장 좋았다. 라는 의미.

설명력을 보면

모형1에서 모형2, 모형3 갈수록 독립변수가 증가하기 때문에 R^과 수정된 R^모두 증가했다.

설명력이 높아지니 추정값의 표준오차가 점차 줄어들어듦.

 

 

세번의 분산분석의 결과가 나옴.

모형 3개 전부 유의하다고 나옴.

회귀 계수도 모두 유의하다고 나옴.

 

시험문제 : 독립변수의 입력방법을 단계적으로 하라고 했을 경우. 최종적으로 선택할 모형은 가장 마지막에선택한 모형으로 응답할 것 ! 

 

728x90
반응형

댓글