모래블로그

5회 빅데이터분석기사 합격 후기 본문

기타

5회 빅데이터분석기사 합격 후기

별모래 2023. 11. 22. 17:29
728x90

5회차 빅분기 합격 후기

 

2022년 12월 16일에 제 5회 빅데이터분석기사(빅분기) 실기 사전 결과 발표가 났다.

나는 빅데이터분석기사 필기 합격한 후 이번 12월 3일에 명지전문대에서 실기 시험을 보고 왔다.

 

빅데이터분석기사 실기 시험은 정보처리기사와 다르게 단답형, 작업형 제1유형, 작업형 제2유형으로 나눠져있었고 실제 코딩을 해야해서 걱정을 많이 했었다.

언어는 파이썬이 익숙해서 파이썬을 선택해서 봤다.

 

문제 유형

단답형 10문제 (각 3점씩 총 30점),

작업형 제 1유형 3문제 (각 10점씩 총 30점),

작업형 제 2유형 1문제 (40점) 으로 이루어져 있다.

 

공부

책은 데이터에듀 빅데이터분석기사 실기 with Python 를 사서 공부했다. 이 책이 실기 시험 보기 전 새로 나왔고, 4회 기출을 포함하고 있어서 선택했는데 아주 잘한 선택이었던 것 같다.


개념을 1회독 후, 작업형 제 1유형, 작업형 제 2유형 코딩 부분을 2-3번씩 봤다. 처음 작업형 제 2유형 봤을 땐 코딩 양이 엄청 많아서 걱정했는데 유형이 다 비슷해서 그래도 금방 익숙해졌다.


Jupyter Notebook으로 계속 코딩해보면서 익숙해지려고 노력했다.
기출문제, 책 안의 모의고사 문제, 연습 문제 정말 열심히 돌려봤다.
그리고 빅분기 관련 카카오 오픈채팅방에서도 많은 정보를 얻었던 것 같다.
이는 열심히 코딩한 흔적,,

 

빅분기 5회 실기 시험 후기

단답형

실제 단답형 문제는 그렇게 어렵지는 않았다.
반정형데이터, DBSCAN, 오버샘플링, 데이터마스킹, Leaky ReLU, f1-score 계산 문제 등등이 나왔는데
특히 DBSCAN은 책에는 크게 강조되어 있지 않은 내용이었으나, 내가 저번 학기에 인공지능 과목을 수강했었는데 거기서 딱 DBSCAN을 배웠어서 딱 문제 보고 감격했었다.
밀도 기반 클러스터링을 보는 순간 이건 DBSCAN이다!
바로 답 쓰고 수업시간에 배웠던게 이렇게 도움이 되니까 너무 기분 좋았었다 ㅎㅎ
하지만 7문제 이상 맞추는 것이 목표였는데, 시험 끝나고 답을 맞춰보니 6문제 맞춰서 그게 살짝 아쉬웠다.

 

작업형 제 1 유형

처음에 작업형 제1유형을 보고 살짝 당황했었다.
생각보다 어려웠고, 문제를 이해하는데 살짝 시간이 걸렸다.
1번은 2L인 쓰레기봉투 가격 평균을 구하는 문제였던걸로 기억하는데, 0원인 가격은 제외하고, 또 다른 조건들도 있었다.
2번은 아마 BMI 문제였고, 정확히는 기억 안나지만 단위에 유의했어야하는 문제였고, 쉬웠다.
3번은 학교 학생 수 관련된 문제였는데, 순전입수가 순전출수 보다 높고? ,, 아무튼 조건이 2개였는데 너무 헷갈렸다. 문제 이해하는데도 시간 걸렸고 .. 전입 수가 최대인 학교에, 아마 전입 수가 전출 수 보다 많은 학교라는 조건까지 더해져서 그 학교의 전체 학생 수를 구하는거였나,, 나도 헷갈리네! 암튼 어떻게 어떻게 해서,, 답을 냈다. 개인적으로 작업형 제1유형 중 가장 어려웠던 문제.

그런데 막상 내고 나오니까 3번만 답을 뭐라고 썼는지 정확히 기억 안나서 이 문제는 틀린 셈 치고 나머지 2문제는 맞췄구나 하고 있었다.

 

작업형 제 2 유형

그동안은 분류 문제를 냈던 것으로 알고 있는데, 이번엔 회귀 문제가 나왔다!
가격을 예측하는 문제였는데,
3회까지는 X_train, X_test, Y_train 데이터를 줬지만 이번에도 4회와 비슷하게 X_train, Y_train 데이터만 주어졌다.
그래서 X_train을 X_train, X_test로 나누고,
데이터 전처리에서는 결측치 확인하고, 결측치가 없었다.
값에 이상치 값이 있는지 sort_values 해서 음수 값이 있는지 확인했고,
범주형은 원핫-인코딩(OneHotEncoder)을,
수치형은 StandardScaler을 이용해서 스케일링 해주고,
이 전처리한 데이터들을 합친 후,
x_train, y_train을 train과 val로 나누어서
RandomForestRegressor와 LGBMRegressor를 이용해서 모델 학습 후, RMSE로 성능평가를 했다.
내가 했을 때는 아마 1300 후반~1400 초반 대 정도 나왔다.
그런데 예시에서 예측 값이 전부 int 형이었는데, 나는 float 형으로 나와서 고민하다가 int형으로 바꿔서 제출했다. 그래서 이렇게 해도 되는건지 아닌건지 몰라서 살짝 불안한 감이 있었다.

 

시험 결과 / 점수 확인

그렇게 12월 16일 4시 10분쯤 사전 결과가 나왔고,
확인해 본 결과!!

예상했던 단답형 4문제는 틀렸고, 나머지는 다 만점을 받았다!
작업형 제1유형 마지막 문제 제출한 답이 기억 안나서 틀렸다고 생각하고 있었는데 맞았었나보다ㅎㅎ
그리고 작업형 제2유형도 30점 이상만 맞았음 좋겠다 했는데 40점 만점 받아서 너무 기분 좋았다.
대충 마지막 문제 점수 받아도 60~70점대라고 생각했는데
88점이라는 높은 점수 받아서 만족스럽다!! 열심히 코딩하면서 공부한 보람이 있다:)

이렇게 정보처리기사, 빅데이터분석기사 2개의 기사 자격증을 따고, SQLD 까지 총 3개의 자격증을 모두 1번 만에 합격해서 따서 너무 기분 좋다.
앞으로도 더 열심히 공부해야겠다는 생각이 들었다:)

 

 

2023.11.22

물론 지금은 시험 유형이 바뀌었습니다. (작년에 빅분기 합격하고 썼던 후기 옮긴 것입니다.)
728x90

'기타' 카테고리의 다른 글

정규표현식(Regular Expression)  (0) 2024.05.19
38회 ADsP 데이터분석 준전문가 합격 후기  (0) 2023.11.22