250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- css
- ORDER BY
- 프로젝트
- date_format
- 아이엠어바텐더
- 백준
- python
- sql
- 단어 공부
- 슬라이싱
- Len
- GIT
- Django
- count
- 파이썬 슬라이싱
- 파이썬 몫
- 코딩테스트 연습
- 설계
- map
- Join
- List Comprehension
- SQL 고득점 Kit
- 파이썬
- YOLOv5
- Python3
- pcce 기출문제
- 프로그래머스
- where
- html
- 데이터
Archives
- Today
- Total
목록통계학 (1)
nan + nan = 2nan
[통계] 다중공선성(Multicollinearity)
국내 부동산 가격 예측 프로젝트를 진행하면서, 상관관계 분석을 한 바 있다. 당시에는 이게 정확히 무슨 의미인지도 모르고, 독립변수 간에만 적용되는지도 모르고 그저 상관관계 분석을 통해서 다중공선성에 해당하는 변수들을 제거한다 라는 말을 강의 때 들었던 기억 때문에 이를 제거해야 한다고만 생각했다. 그리고 이후에 포트폴리오를 만들고, 금융사 면접을 한 번 봤을 때 이에 대한 질문이 나왔을 때 제대로 이해하고 있지 못 했다. 그래서 이에 대해 이론적으로 깊게 파고들지는 못 해도 이것이 무엇을 의미하는지, 왜 하는지에 대해 다시 정확하게 정의를 정립하고 가야겠다. 다중공선성은 회귀분석의 전제 가정인 독립변수 간 높은 상관관계가 나타나 조건을 위배하는 경우를 의미한다. 즉, Target 값을 제외한 나머지 변..
Statistics
2022. 5. 22. 14:41