Python을 활용한 데이터 과학
데이터 엔지니어링과
머신러닝 모델링
개발자와 분석가를 위한 PYTHON
![]() |
데이터 엔지니어링과 머신러닝 모델링 | Python을 활용한 텍스트분석(가제)[추후개설] |
---|
결측치 처리, 이상치 제거, 왜도 등 데이터 전처리로 문제 해결
기존 변수에서 파생변수 생성, 자료 변환 등 분석에 적합한 형태로 변환
Scikit-learn 분류기 API 작동 방식 이해 (교차검증, 하이퍼파라미터, 최적 모델 탐색 등)
알고리즘(KNN, 로지스틱회귀, GNB, SVC, 앙상블) 적용 및 평가
불균형 데이터에 대한 예측 방안 구축
본 과정은 머신러닝의 특성에 맞게 데이터 전처리, 특성 공학 및 기계학습 분야의 예측 알고리즘을 적용하여
최종적인 모델을 도출하고자 합니다. 현장 데이터를 통해 머신러닝으로 문제 해결하는 과정을 스토리텔링으로 구성하였습니다.
본 과정을 통해 Python을 활용한 Data Engineering, Machine learning, Algorithm 을 경험하시기 바랍니다.
python을 활용한 데이터 과학 - 기초과정의 다음 과정으로 기초 과정을 수강했거나 아래 항목을 자유롭게 이용할 수 있는 분들에게 추천 드립니다.
KNIME을 활용한 데이터 과학(KNIME for Data Science)
데이터 분석 강의 또는 도서 집필을 계획 중이신가요?
‘빅데이터 러닝센터’에서는 당사와 교육 컨텐츠를 공동으로 개발할 수 있는 강의 파트너, 집필 파트너를 찾고 있습니다.