0. 1주 차 학습목표
- Digital Transformation 세미나 (비즈니스 데이터 개념과 다양한 업종의 활용 사례 · 의사결정 · 기술과 역할 및 대응전략)
- EDA (Exploratory Data Analysis) 탐색적 데이터 분석
- python을 이용한 데이터 분석 개요
- google colab, Jupyter Notebook 활용
- 아나콘다 설치 및 셋업
1. 학습 후기
- 데이터 분석의 목적과 흐름
데이터 분석의 핵심가치는 (비즈니스 데이터의 경우)
1. 수집한 데이터에서 어떤 가치를 뽑아내는가? (비슷한 고객들은 비슷한 의사결정을 할까?)
2. 데이터를 분석하여 어떤 것을 얻어내고 싶은가? (고객들을 비슷한 유형들로 세분화)
3. 데이터를 통한 올바른 의사 결정을 할 수 있는가? (비슷한 고객들이 잘 세분화 되었다면, 새로운 고객에 대하여 유사한 집단을 파악하여 적용 가능)
이다.
- 데이터 분석 과정
데이터 수집 → 데이터 탐색(EDA) → 데이터 전처리 → 데이터 모델링
- 앞으로의 학습에 중심으로 둘 점
나는 이번 교육과정을 통해 제조업의 혁신을 가져오는 데이터분석보다는, 디지털 trasfomation 된 정보로 고객(사람)의 특성을 파악하여 더 나은 비즈니스 의사결정을 만들 수 있는 데이터 분석자가 되는 방법에 대해 알 수 있을 것 같다.
1주차는 데이터 분석의 다양한 산업에서의 사례와 전반적인 교육과정 개요에 대해 알 수 있었다.
- 어떻게 하면 데이터 분석 도구들을 빨리 쓸 수 있는지를 고민하는 것이 바람직
- 개발환경 구축_1 : anacoda 설치
- 개발환경 구축_2 : conda 생성
conda --version //콘다 버전 확인
conda create -n datascience python=3.8 anaconda //python버전 3.8인 "datascience"라는 name의 실험실 만들기
conda activate datascience // "datascience" 실험실 입장
conda deactivate // 실험실 퇴장
- 개발환경 구축_3 : Jupyter Notebook
jupyter notebook //실험실(datascience)입장 후 실행
<주피터 노트북 기본 구성>
- File 탭 : Make a copy : 똑같은 거 하나 더 / Download as : 다양한 형식으로 저장 / Close and Halt : 주피터 노트북 완전히 종료
- Edit 탭 : cell 단위 기능들
- View 탭 : 볼 수 있는 구성 변경 기능들
- Insert 탭 : cell을 추가(A) 하고 제거(B)
- Cell 탭 : cell 을 실행하고 넘어가거나 타입 바꾸는 등 실행 관련 기능
- Kernel 탭 : prompt 관련 기능들
- Widgets 탭 : 주비터노트북 화면 관련
- help 탭 : 도움되는 페이지 리다이렉트
- 개발환경 구축_4 : (optional) google colab을 통한 강의자료 확인
Colab : 구글에서 만든 웹에서 접속 가능한 주피터 노트북
장점 : 코드공유나 머신러닝이나 딥러닝 설치이슈 해결 +무료
소개페이지 : Colaboratory에 오신 것을 환영합니다 - Colaboratory (google.com)
'빅데이터 분석 첫걸음 시작하기' 카테고리의 다른 글
2주차_Python 기본 문법 (0) | 2022.03.08 |
---|