nan + nan = 2nan

[개요 작성] 국내 부동산 가격 예측 데이터 분석 팀 프로젝트 (10.15 ~ 10.24) 본문

Project/팀 프로젝트

[개요 작성] 국내 부동산 가격 예측 데이터 분석 팀 프로젝트 (10.15 ~ 10.24)

2nan 2021. 10. 17. 19:01
728x90

회의를 진행하기 앞서 각자 방향성이나 자료들을 캐치-업 해서 브레인스토밍하는 방식으로 진행한다고 했기 때문에

우선 내가 생각하는 방향성과 자료를 리스트 업 하는 것을 우선적으로 해야 했다.

 

첫 번째로, 해당 데이터 프로젝트의 목적을 정하는 것.

프로젝트를 제안한 장본인으로서, 해당 프로젝트의 목적은 국내 부동산 가격에 대한 관심이 많고, 프로젝트를 진행하는 팀원들의 연령층이 이젠 학생에서 벗어나서 사회인이 되는 과정에서 부동산에 대한 관심을 가지고 앞으로 어떻게 될 지 분석하면서 부동산 관련 정보와 머신러닝 기술의 인사이트를 얻는 것이었다.

내가 생각했던 목적은 이렇지만, 가장 중요한 것은 프로젝트에 있어 어떤 기준으로 평가가 되는지를 보면 어느 정도의 방향성을 가질 수 있다고 생각했다.

 

담당자님께서 이전에 보내주신 프로젝트 평가항목을 본다면

 

  • 프로젝트

- 프로젝트의 아이디어와 주제가 창의적이고 참신한가?

- 학습한 교과 내용을 잘 반영하였는가?

- 머신러닝에 대한 이해를 바탕으로 프로젝트가 기획되었는가?

 

  • 사업성

- 고객의 호기심 유발 및 사업성

- 고객의 서비스 사용 가능성

 

  • 프로젝트 산출물

- 제출 기한 내에 최종 산출물을 제출하였는가?

- EDA를 충실히 수행했는가?

- 구현된 기능의 전문성

 

  • 발표 및 시연

- 프로젝트에 대해 잘 설명하였는가?

- 주어진 시간을 적절히 사용하여 발표를 진행했는가?

- 질문에 적절히 대응하였는가?

 

이러한 4가지로 구성이 되어있다. 여기에서 프로젝트와 사업성 평가 항목에 걸맞는 프로젝트 결과물을 산출해내는 것이 가장 중요하다고 판단을 했다.

주제나 아이디어 부문에서는 오징어게임 트윗 횟수같은 아이디어가 참신할지라도, 

해당 프로젝트를 통해 여러 인사이트를 얻을 수 있고 알고 싶다는 생각이 드는 주제이기 때문에 괜찮다고 생각한다.

학습한 교과 내용의 경우, 데이터 전처리에서는 pandas, numpy 등을 적절히 잘 사용하고 

matplotlib과 seaborn을 적절히 이용해서 시각화를 통해 EDA를 근거 있게 진행하는 것이 중요할 것이라고 생각한다.

그리고 직접 모델을 학습하고 예측하는 모델링 과정에서는 아무래도 부동산 가격에 관한 부분이기 때문에

회귀 분석으로 진행해야 할 것이고, 회귀 분석에서 가능한 모든 분석을 사용을 해보고 가장 괜찮은 예측률을 

뽑아내는 모델을 선정하는 것이 중요할 것이라고 생각했다.

사업성 부분에서도 부동산 가격이 앞으로 올라갈 것이다, 내려갈 것이다에 관해서는 관심이 충분하다고 생각했다.

왜냐면 1인 가구가 급증하고 있고, 해당 가구들이 가계 지출 중 가장 걱정하는 부분이 '주거비'라는 기사도 이전에 본 적이 있다. 

또한 누구나 집이 필요하고 살면서 가장 지출이 많은 부분 중 하나가 주거 부분이기 때문에 호기심을 충분히 유발하고,

모델링이 괜찮게 나온다면 서비스 사용을 충분히 할 것이라고 생각했다.

 

 

앞서 말이 길었는데,

이 프로젝트의 주제

 

국내 부동산 가격 분석 및 예측

 

 

해당 프로젝트의 목적을 한 줄로 정리하자면

 

'국내 부동산 가격에 영향을 미치는 요인들을 수집하고 해당 데이터를 통해 앞으로 가격이 어떻게 될 것인지 예측하여 개인의 부동산 관련 정보 탐색 비용을 줄이고 미리 대처하기 위함'

 

 

이라고 나는 정의하고 싶다.

자료를 더 Find에서 곧 있을 회의 준비를 잘 하고, 초석을 잘 다져야겠다.

힘내자

 

Comments