일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- SQL 고득점 Kit
- 파이썬 몫
- 프로젝트
- css
- Join
- python
- 설계
- count
- date_format
- html
- 코딩테스트 연습
- 파이썬
- Django
- 백준
- 데이터
- where
- 프로그래머스
- sql
- 단어 공부
- ORDER BY
- GIT
- map
- 파이썬 슬라이싱
- 아이엠어바텐더
- pcce 기출문제
- YOLOv5
- Python3
- 슬라이싱
- Len
- List Comprehension
- Today
- Total
목록Statistics/Machine Learning (12)
nan + nan = 2nan
최근 빅데이터 분석에 관한 책을 읽고 있는데, 해당 글의 저자가 구글 트렌드를 통해서 지난 미 대선 당시 트럼프와 힐러리의 대선 결과를 예측하고 맞추었다는 사실을 알게 되었다. 사실 국내에서는 여러 여론조사기관이 발표하는 지지율 조사가 있지만, 이 경우 예를 들어 1000명을 대상으로 조사를 했다고 하더라도 실제 조사에 응답한 응답률은 그보다 낮을 수 밖에 없고 조사의 신뢰도에 대한 의구심이 항상 들 수 밖에 없었다. 그래서 나도 이러한 툴을 사용해서 직접 이번 대선 결과에 대해 분석해보고 이런 결과가 나온 이유는 무엇일까?라는 생각에서 구글 트렌드를 이용해서 분석해보기로 했다. 단, 구글 트렌드가 미국에서는 구글 사용량이 대부분 높기 때문에 효과적이겠지만 우리 나라의 경우 네이버, 카카오 등 구글 이외..
머신러닝 기계 학습 : 기계를 가르친다 기계를 어떻게 가르칠 것인가? 에 따라 두가지 형태로 나눠 생각한다. Supervised Learning(지도 학습) Unsupervised Learning(비지도 학습) 지도학습 (Supervised Learning) 데이터에 Label(정답)이 미리 정해져 있을 때 가능 프로그램에 입력 값을 주면 출력 값을 기계가 알아서 예측해서 출력해주는 형태 지도 학습은 또 다시 Regression (회귀) 와 Classification (분류) 로 세분화 Regression (회귀) : 연속된 값, 수치, 즉 '얼마나'를 예측 Classification (분류) : 연속적이지 않은 값, '무엇'을 예측 비지도학습 (Unsupervised Learning) 레이블이 정해져 ..