📂 Etc/✨ 데이터 관련 자격증 후기

[빅데이터 분석기사] 실기 6회 만점 후기 (합격 Tip, 기출 풀이 공유)

민이언즈 2023. 7. 25. 13:26

개인적으로 공부하며 정리한 내용과 팁들은 깃허브와 캐글링크에서 보실 수 있습니다.

기출 풀이 및 코드 정리 : https://github.com/Minju-nimm/BDA_Certificate

 

GitHub - Minju-nimm/BDA_Certificate

Contribute to Minju-nimm/BDA_Certificate development by creating an account on GitHub.

github.com

 

🏆 6회차 합격 후기

- 5회차까지 출제됐던 단답형 유형에서 통계 검정으로 유형이 바뀐 첫 회차였습니다.

- 원래 ADP를 공부하고 있어서 통계 검정은 큰 무리없었지만, 문제의 가독성 및 공지된 패키지 외 출제로 논란이 적지않은.. 회차였습니다. ㅠㅠ

- 우연히 시험 문제들을 적중해서 좋은 점수를 받을 수 있었습니다.

- 작업형 1유형을 공부할 때 datetime, str 관련 함수들을 중심으로 공부했습니다.

- 작업형 3유형은 카이제곱검정에서 적합성 검정과 독립성 검정의 차이를 이해하고 예시 문제들을 풀었던 게 큰 도움이 됐습니다.

- 특히 데이터 마님 홈페이지가 큰 도움이 됐습니다!

- 목표가 100점이어서 나름 열심히 했던터라, 시험보고 나오면서 무조건 합격이다하는 느낌이 있었습니다. ㅎㅎ

😄 합격 Tip

캐글 빅분기 페이지와 데이터 마님 사이트에 복기된 기출문제들을 주로 다루고, 공부가 더 필요한 부분은 개인적으로 정리했습니다.

https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr

https://www.datamanim.com/dataset/ADPpb/prepare.html

작업형1

- 작업형1의 경우 쉬운듯 하지만, 회차가 거듭할수록 은근 까다로운 유형이 출제되고 있습니다.

- 특히 신경써서 공부했던 부분은 datetime, str, groupby, sort_values 관련 함수였습니다.

- 전처리 함수에 등장하는 문제들은 캐글과 데이터마님 홈페이지를 참고했으며, 필요 시 파이썬 내장 데이터로 문제를 직접 만들었습니다.

작업형2

- 작업형2는 분류 및 회귀 예측 모델을 구현하는 유형으로 '전체적인 흐름'을 이해하는 것이 중요합니다.

- 데이터 로드 및 전처리, 모델링, 하이퍼 파라미터 튜닝 등 각 단계가 의미하는 바를 알아야하고 데이터를 알맞게 적용시켜야 합니다.

- 문제 유형이 거의 유사하기 때문에 나만의 Baseline 코드를 만들어서 연습했고, 이를 토대로 빅분기 캐글 경진대회에 코드를 제출해서 점수를 확인하면서 성능을 올렸습니다.

- Baseline을 정리하고 캐글에 제출한 경험 덕에 실제로 시험장에서 30분만에 작업형2를 다 풀었습니다. 👍

Baseline 관련

https://github.com/Minju-nimm/BDA_Certificate/blob/master/%EC%9E%91%EC%97%85%ED%98%952/Baseline.ipynb

- 저는 크게 0~5단계로 나눠서 진행했습니다.

- 모델링의 경우 랜덤포레스트와 lgbm을 준비해갔고, 평가지표에 따라 비교한 후 최종 모델을 선택했습니다.

- 6회 실기 시험장에서 하이퍼 파라미터는 튜닝하지 않았습니다. (튜닝하지 않아도 val data가 0.97정도로 높게 나왔었습니다.)

Baseline 목차
0. 데이터 로드
1. 데이터 EDA
2. 전처리 (결측치 처리, 불필요 칼럼 정리, 스케일링 및 인코딩 등)
3. 검증 데이터 분리
4. 모델링
5. 제출 : df, csv

 

 

빅분기 캐글 기출별 노트북 공유

- [5회 캐글 노트북 : 시험 환경 고려] https://www.kaggle.com/code/minjunim/5-lgbm-rmse-1249

- [5회 캐글 노트북 : ipynb, 설명 형식]

https://www.kaggle.com/code/minjunim/5-xgb-rmse-1240

- [4회 캐글 노트북 : 시험 환경 고려]

https://www.kaggle.com/code/minjunim/4-lgbm-0-313

- [3회 캐글 노트북 : 시험 환경 고려]

https://www.kaggle.com/code/minjunim/3-lgbm-roc-0-82

작업형3

- 데이터마님, 캐글, 데이터 에듀(책 구매할 경우에만 열람 가능) 예상문제를 모두 풀어보았습니다.

- 6회차 실기에는 statsmodel이 지원되지 않아서 (논란의 문제가 있었지만 ^^;) scipy에 있는 라이브러리를 집중해서 공부했습니다.

​- 기초 통계 지식이 없는 분들은 아래 책 추천 참고하셔서, 정독하시면서 공부하시면 도움될 것 같습니다.

관련 책 추천

 

파이썬 한권으로 끝내기: 데이터분석전문가(ADP) + 빅데이터분석기사 실기대비 | 데싸라면 - 교보

파이썬 한권으로 끝내기: 데이터분석전문가(ADP) + 빅데이터분석기사 실기대비 | ■ 한 권으로 데이터분석전문가는 물론 빅데이터분석기사 취득까지 한 번에!■ 초보자도 쉽게 코드를 읽을 수 있

product.kyobobook.co.kr

ADP를 공부하면서 구매했던 책인데, 통계 검정 오류가 꽤 있는 것 같지만

ADP와 빅분기 둘다 공부하시는 분들이라면 추천드립니다.

작업형1, 2 유형 처음 접하시면 많은 도움될 것 같습니다.

 

사실 오타와 오류가 적지않은 책이지만, 3유형 예상문제 푸는 데 도움받았습니다.

앞으로 개정된다면 더 괜찮을 책이라고 생각합니다.

파이썬을 처음 접하는 분들 & 작업형3 감이 안잡힌다하시는 분들 추천드립니다.

 

통계가 너무 어렵다 하시는 분들께 추천드립니다.

관련 전공자, 혹은 통계 잘 알고있는 분들께는 크게 도움되지 않을 수 있지만

카이제곱검정과 비모수 검정, 회귀분석이 쉽게 쓰여져있습니다!


자격증 공부 관련 QnA는 댓글 남겨주시면 소통가능합니다 ! 

728x90