일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 두바이ai
- 싱가포르ai
- 머신러닝
- AIVLE
- 자취생성지
- 에코백대란
- 자연어처리
- ai도우미
- ai리더도시
- 에이블러
- AI
- dx
- 트조에코백
- 야무진소비
- 미니프로젝트
- KT AIVLE
- 에이블스쿨
- 소비트렌드
- 에이뿔
- claue
- 딥러닝
- DX트랙
- 일론머스크
- 앙상블
- ai도시디자인
- 트조백
- 한정판템
- KT에이블스쿨
- DX컨설턴트
- KT
- Today
- Total
따뜻한 전당포
[DX트랙] KT AIVLE(에이블스쿨) 10주차 정리(22.09.26~22.09.30) 본문
10주차 DX트랙 일정
날짜 | 일정 | 간단한 교육 내용 |
22.09.26 DAY41 | 미니프로젝트3차-1 | 머신러닝을 활용한 악성사이트 탐지 모델링1 |
22.09.27 DAY42 | 미니프로젝트3차-2 | 머신러닝을 활용한 악성사이트 탐지 모델링2 & Kaggle Competition |
22.09.28 DAY43 | 미니프로젝트3차-3 | 네비게이션 도착시간 정확도 개선1 |
22.09.29 DAY44 | 미니프로젝트3차-4 | 네비게이션 도착시간 정확도 개선2 |
22.09.30 DAY45 | 미니프로젝트3차-5 | 네비게이션 도착시간 정확도 개선3 & 발표 |
미니프로젝트3차
■ 머신러닝을 활용한 악성사이트 탐지 모델링
악성 사이트를 판별할 수 있는 AI모델 만들기라는 주제로 Kaggle competition이 진행되었다.
▼ 진행과정
1) 환경준비
라이브러리 불러오기
데이터 불러오기
2) TRAIN데이터 전처리
* train data는 모델을 만들기 위해 활용하는 데이터
열제거, 추가
결측치 처리
단변량, 이변량 분석
3) TEST데이터 전처리
*test data는 검증하기 위한 데이터
TRAIN 데이터와 동일한 전처리 진행
4) 모델링
Deeplearning은 해보았으나 성능 향상이 어려웠음
RandomForest는 성능이 향상되었으나 다른 보델보다 낮은 성능
LinearRegression는 하이퍼파라미터 튜닝 옵션 개수가 적음
XGBoost 성능이 가장 많이 향상됨
5) 검증
케글은 최대 20번까지 수정데이터를 올릴 수 있고 제일 높은 점수가 최종 Score가 된다.
여러가지 방법을 시도한 끝에 약 200명 중 금달의 최종 순위는 9위!!! 생각보다 높은 등수에 짜릿했다.


■ 네비게이션 도착시간 정확도 개선
3차 미니프로젝트의 2번째 주제는
ai를 활용하여 KT 원내비의 도착 예정 시간 정확도를 높이는 모델 만들기 였다.
▼ 느낀점!
데이터를 분석하고 모델 성능을 높이는 '기술적 측면의 역량'과 '말로 풀어내는 역량'이 중요하다는 것을 느꼈다.
실습을 통해 진행해본 변수외에도 많은 변수들이 많을 것으로 예상한다.
그리고 KNN INPUTER를 사용했더니 더 높은 성과를 낼 수 있었다.
내가 만약 DX컨설턴트라면 최적의 모델을 만들고 이를 고객에게 설득하는 역량도 중요하다는 것을 배웠다.
이번 미니프로젝트를 통해 유사 경험을 통해 모델링을 해보고 PPT를 통해 간략하게 담아 전달하는 능력치를 키울 수 있었다.
2022년 제3회 K-디지털 트레이닝 해커톤
그 동안 남몰래 틈틈히 준비했던 해커톤...!! 1차 심사에 통과했다는 연락을 받았다...ㅠ0ㅠ

이글을 작성하는 시점에는 이미 해커톤이 끝났다...ㅎㅎ 결과는 다음 글에서 확인!!ㅎㅎㅎ