학술연구자

  • Home
  • 정규교육
  • 학술연구자
  • 데이터 엔지니어링과 머신러닝 모델링 - Python을 활용한 데이터과학 심화과정

데이터 엔지니어링과 머신러닝 모델링 - Python을 활용한 데이터과학 심화과정

₩440,000 교육신청
  • #Python
  • #분석과정

Python을 활용한 데이터 과학심화과정2

데이터 엔지니어링과
머신러닝 모델링

과목 기간 일정
기간 일정 장소 문의
2020년 10월 21일 (수)~
2020년 10월 22일 (목)
총 2일 / 12 시간
10:00 ~ 17:00
(주)데이타솔루션 10층 빅데이터러닝센터 Training Room TEL : 02-3467-7221
training@datasolution.kr

Phython을 활용한 데이터 과학 Series!

기초과정

개발자와 분석가를 위한 PYTHON

심화과정데이터분석을 위한 Scraping과 DB구축 데이터 엔지니어링과 머신러닝 모델링 Python을 활용한 텍스트분석(가제)[추후개설]

결측치 처리, 이상치 제거, 왜도 등 데이터 전처리로 문제 해결

기존 변수에서 파생변수 생성, 자료 변환 등 분석에 적합한 형태로 변환

Scikit-learn 분류기 API 작동 방식 이해 (교차검증, 하이퍼파라미터, 최적 모델 탐색 등)

알고리즘(KNN, 로지스틱회귀, GNB, SVC, 앙상블) 적용 및 평가

불균형 데이터에 대한 예측 방안 구축

본 과정은 머신러닝의 특성에 맞게 데이터 전처리, 특성 공학 및 기계학습 분야의 예측 알고리즘을 적용하여 최종적인 모델을 도출하고자 합니다. 현장 데이터를 통해 머신러닝으로 문제 해결하는 과정을 스토리텔링으로 구성하였습니다. 본 과정을 통해 Python을 활용한 Data Engineering, Machine learning, Algorithm 을 경험하시기 바랍니다.

python을 활용한 데이터 과학 - 기초과정의 다음 과정으로 기초 과정을 수강했거나 아래 항목을 자유롭게 이용할 수 있는 분들에게 추천 드립니다.

Python을 활용한 데이터과학 - 심화과정을 수강하기 전 체크사항!

  • 1. Python 환경, pip, jupyter notebook
  • 2. string의 split, join, 합치기, 나누기
  • 3. list, dict, tuple, set 개념
  • 4. Index, slicing 개념
  • 5. for, while로 상기 자료들의 다루기
  • 6. numpy 행렬 연산, pandas dataframe 다루기 및 chart 기본
  • 7. matplotlib 기본
  • ※ 상기 항목에 대한 기본 개념이 없을 경우 수강이 어렵습니다.

이런 분께 추천드립니다.

  • Python을 활용한 데이터과학 - 기초과정을 수강하신분
  • Python을 활용하여 데이터 전처리 과정을 경험해 보고 싶은 분
  • Python을 활용하여 머신러닝 알고리즘과 모델 수립이 필요하신 분

강사소개

최재석 (전문위원) / 1일차 강사

  • 데이타솔루션 전문위원 / 경영공학, 최적화 전공
  • Python 을 활용한 데이터과학 - 기초과정 교육 강사
  • 행정안전부 빅데이터 플랫폼 구축 사업 PM
  • 건강보험공단 빅데이터 플랫폼 구축 사업 컨설팅



조상구 박사 / 2일차 강사

  • 식품안전정보원 책임연구원 / 한양대 기술경영학 전공 / KAIST 경영과학(석사)
  • 식약처 식품안전부문 지능형 농축수산물 안전관리 체계 구축
  • CRM부문(Oracle Siebel) 데이터 및 솔루션 구축 컨설팅
1일차 - 최재석 박사 진행
자료 획득 및 분석
-. numpy와 pandas 데이터 분석
-. 데이터 시각화

데이터 전처리(특성공학)
-. 결측치 대체, 이상치 처리
-. 왜도 처리
-. 파생변수 생성

데이터 시각화
-.metplotlib와 seaborn 시각화


2일차 - 조상구 박사 진행
머신러닝 라이브러리 sklearn
-. API 작동방식
-. 교차검증, 하이퍼파라미터
-. 파이프라인, 모형의 성능지표

지도학습 알고리즘 이해 및 실습
-. K-최근접 이웃, 나이브 베이지 분류
-. 로지스틱회귀, 서포트벡터머신
-. 의사결정나무, 앙상블 모델링(배깅, 부스팅)

불균형데이터의 모델링
-. 손실함수 조정, SMOTE

BECOME A PARTNER?

데이터 분석 강의 또는 도서 집필을 계획 중이신가요?
‘빅데이터 러닝센터’에서는 당사와 교육 컨텐츠를 공동으로 개발할 수 있는 강의 파트너, 집필 파트너를 찾고 있습니다.

파트너 지원하기