이번에 구글 머신러닝 부트캠프를 진행 하며, 처음으로 머신러닝 및 데이터 사이언스 커뮤니티를 접하였습니다.
단순히 머신러닝 개념만 있고 실질적인 데이터 경험이 없는 저로서는 어떻게 시작해야할지 막연하고 고민이 많았는데,
이번에 시작하며 얻은 여러 정보 및 자료들을 정리해두고자 합니다.
처음 시작하는 캐글인 만큼 혹여나 다른 추가적인 좋은 자료가 있다면 많이 공유해주시면 감사할 것 같습니다!
0. 구글 머신러닝 인원의 캐글 입문서
https://jun048098.tistory.com/18
다음의 질문에 도움을 드릴 수 있습니다.
Featured, playground가 뭔가요?
Kaggle은 GPU가 되나요?
로컬에서 작성한 노트북이나 csv파일도 올릴 수 있나요?
저장과 제출 어떻게 하죠?
Save & Run All은 뭐길래 오래 걸리나요?
1. 캐글 기본 설명
https://www.kaggle.com/code/jasonheesanglee/about-kaggle-kor
캐글 플랫폼에 대해 기본적인 설명이 적혀있습니다.
한국어인것이 매우 매력적으로 다가왔습니다.
2. 캐글 그랜드 마스터 특강
https://www.youtube.com/watch?v=TwF2EB9UCsI
알고리즘에 떠서 보게된 영상입니다. 캐글 그랜드 마스터이신 분이 다른 프로그램에서 특강을 열어준 것을 업로드해둔 것 같았습니다. 처음 시작하는데 큰 틀을 잡는데 많은 도움이 되었습니다.
3. 캐글 교육용 대회 풀이 예시
https://www.youtube.com/watch?v=_iqz7tFhox0
파이썬 라이브러리를 활용한 머신러닝
: 해당 내용에서 머신러닝을 한다면 반드시 알아야하는 교과서라 이야기해 주었습니다.
직접 구매해서 학습을 진행해보니, 사이킷런에 관련된 자료가 있습니다. 딥러닝보단 머신러닝을 위한 학습서 같습니다.
https://product.kyobobook.co.kr/detail/S000001057726
예전에 올렸던
https://poca.tistory.com/entry/독학으로-머신러닝-개발자로-입문하기-완벽-정리
영상의 32:59 부분에 나온 영상입니다.
캐글 입문 추천 자료가 있을까요? 에 대한 답변으로 캐글에서 운영하는 교육용 대회를 예시로 풀어나갑니다.
4. 현직자 추천 책
머신러닝 딥러닝 문제해결 전략
https://product.kyobobook.co.kr/detail/S000001953764
해당 책은 완전한 초심자에게는 어렵지만 어느정도 공부를하면 크게 도움되고 디게 좋은 지침서가 된다고합니다.
3번의 파이썬 라이브러리를 활용한 머신러닝책을 빠르게 읽어내고, 해당 책을 정독할 예정입니다.
해당 책을 공부한 결과, 확실히 캐글에 큰 도움이 되었습니다. 그러나, NLP에 대한 내용이 많이 적어서 아쉽습니다.
아니, 아직 읽는 중이라 확실하진 않지만 아예 없다고 판단되었습니다.
5. 자연어 학습 [ 트랜스포머 ]
4번을 통해 캐글에 대한 학습을 진행했으나, 구글 머신러닝 부캠 수료에 조건이 맞는 대회가 모두 NLP이였습니다.
제 친구에게도 물어보았을때 NLP 즉, 트랜스포머는 필수적이고 이젠 거의 모든 문제가 NLP라는 이야기를 들었기에 트랜스포머에 대해 학습을 하고 캐글에 도전하고자 합니다.
아래 공식 사이트를 통해 학습을 진행하고 캐글 대회에 참여합니다.
https://huggingface.co/learn/nlp-course/ko/chapter1/1
https://huggingface.co/docs/transformers/v4.42.0/ko/quicktour
'데이터 사이언스 > 캐글' 카테고리의 다른 글
결측치를 처리하는 방법 (0) | 2024.08.16 |
---|---|
앙상블 기법 (0) | 2024.08.16 |
Pandas Dataset 용량 줄이기 (0) | 2024.08.01 |
캐글 데이터 셋 코랩에서 사용하기. kaggle data on colab (0) | 2024.07.16 |