학술연구자

  • Home
  • 정규교육
  • 학술연구자
  • (Live) R for Text Analysis (웹크롤링과 텍스트 마이닝)

(Live) R for Text Analysis (웹크롤링과 텍스트 마이닝)

₩350,000 교육신청
  • #R
  • #중·고급
Online(zoom) 진행

R for Text Analysis
웹 크롤링 및 텍스트 마이닝

과목 기간 일정
기간 일정 장소 문의
2021년 05월 20일 (목)~
2021년 05월 21일 (금)
총 2일 / 12 시간
10:00 ~ 17:00
(주)데이타솔루션 10층 빅데이터러닝센터 Training Room TEL : 02-3467-7221
training@datasolution.kr

온라인 비대면 LIVE 교육 안내

본 교육 과정은 온라인(Zoom)으로만 진행되는 과정입니다.
온라인(Zoom)을 통해 교육 수강을 희망하시는 분들께서 신청 하시기 바랍니다.

  • 해당 온라인 Live 교육 과정은 정가로 진행 됩니다.
  • 해당 온라인 Live 교육은 2021년 5월 14일까지 선결제(입금)해주신 접수자에 한해서 실물 교재를 택배로 발송 해드립니다. (교재 수령 후 교육 취소 시 수강료에서 50%를 차감하여 환불해 드립니다.)
  • ③ 강의는 Zoom을 이용하여 Live로 진행 됩니다. (교육 종료 후 별도의 VOD는 제공되지 않습니다.)

    ※ 웨버나 솔루션 Zoom은 인터넷에 연결 된 PC라면 어디서든 접속하여 수강할 수있는 솔루션 입니다.

  • ④ 온라인 Live 교육을 신청하신 분들에 한에 교육 2일 전 메일/문자를 통해 접속 링크 및 학습 방법을 안내 할 예정입니다.
  • ⑤ 스마트폰을 통해서는 접속이 불가합니다.

Q. 논문 or 보고서를 써야하는데 데이터를 어떻게 수집 하지?

R for Text Analysis (웹 크롤링 및 텍스트 마이닝) 과정을 들으면
수집부터 분석까지 한방에 해결할 수 있습니다!

Q. 웹 크롤링이란?

웹 브라우저 상에서 눈에 보이는 데이터를 수집하여 분석가가 원하는 형태로 재가공하는 일련의 과정입니다.

Q. 웹 크롤러란?

웹 크롤러란 웹 사이트를 자동적으로 탐색하는 프로그램이며, 웹크롤링을 수행하는 프로그램을 웹 크롤러라고 합니다.

R for Text Analysis (웹크롤링과 텍스트 마이닝) 과정을 수강한다면?

아래의 수집을 위한 R 크롤러 코드를 한 줄씩 상세하게 소개해 드릴 예정입니다.

  • 인터넷 사용자들의 리뷰가
    올라오는 포털 정보 수집
  • 인터넷, 카페, 블로그 및 뉴스
    댓글과 반응수 수집

수집한 텍스트 데이터를 분석하여 여러 사람들의 공통적 의견 추출

강의 목표

연구원 및 대학원생 본인이 관심있는 Text Data를 스스로 수집하고,
분석할 수 있는 과정을 배웁니다.

강의 내용

연구원 및 대학원생을 위한
  • 텍스트 수집
    (웹크롤링)
  • 텍스트 분석
    (텍스트 마이닝)
을 목표로 합니다.

수강대상

  • R 자료형 (벡터, 데이터프레임, 리스트 등) 기본 문법을 충실히 습득하신 분
  • 연구원 및 대학원생으로 보고서 또는 논문 작성을 위한 원하는 텍스트 데이터 수집이 필요하신 분
  • 인터넷 카페, 블로그 등에서 텍스트 데이터를 수집하고 싶으신 분

수강 전 필수 조건은?

  • R for Business Insight(데이터 핸들링) 수강 하신 분들을 대상으로 합니다. 또는 R을 활용한 데이터 처리 수준이 중급이상의 사용자를 대상으로 합니다.

강사소개

나성호 강사

학력
  • 한양대학교 경영학과 MIS 전공 박사과정 재학 중 (2018~현재)
  • 서울대학교 경영학과 마케팅 전공 석사 (2002)
  • 고려대학교 식량자원학과 학사 (2000)
경력
  • 헬로데이터사이언스 대표
  • 現 패트스캠퍼스 전임강사
  • 하나금융경영연구소 (2013~2019)
  • 하나카드 (2010~2013)
  • 현대캐피탈 (2009~2010)
  • 삼성화재해상보험 (2002~2009)
주요수행업무
  • 웹 크롤링과 텍스트마이닝을 활용한 트렌드 분석
  • 데이터 시각화 및 탐색적 데이터 분석
  • 다양한 머신러닝 알고리즘을 활용한 분류/회귀 모형 개발
1일차
10:00 ~ 11:20 웹크롤링 프로세스의 이해
11:30 ~ 13:00 HTTP 통신 및 HTML 기초
14:00 ~ 15:20 [실습] 포털 카페 본문 수집
15:30 ~ 17:00 [실습] 포털 블로그 본문 수집

2일차
10:00 ~ 11:20 텍스트 마이닝 프로세스의 이해
11:30 ~ 13:00 텍스트 전처리: 대형 포텀ㄹ 블로그 본문
14:00 ~ 15:20 [실습] 형태소 분석, 말뭉치 생성
15:30 ~ 17:00 [실습] 고빈도 단어 시각화




연관 교육

  • 2일만에 익히는 R 기초 통계분석

    • #R
    • #기초
    자세히 보기
  • 2일만에 익히는 R 중급 통계분석

    • #R
    • #중·고급
    자세히 보기
  • 4일만에 익히는 R 기초/중급 통계분석 패키지 이벤트

    • #R
    • #기초
    자세히 보기

BECOME A PARTNER?

데이터 분석 강의 또는 도서 집필을 계획 중이신가요?
‘빅데이터 러닝센터’에서는 당사와 교육 컨텐츠를 공동으로 개발할 수 있는 강의 파트너, 집필 파트너를 찾고 있습니다.

파트너 지원하기