안녕하세요. 부자아빠 셜로키입니다.
이번 포스팅은 머신러닝/딥러닝이라 부르는 AI 기술의 전문가로 거듭나기 위해 무엇을 공부해야하고, 어떻게 실력을 쌓아야 할지에 대해 다뤄보고자 합니다. 요새 산업 전반에 있어서 가장 널리 알려져 있고, 전도유망한 분야이기 때문에 많은 분들이 관심을 가지고 공부도 하고 도전하고 있습니다.
하지만. 워낙 기술 진입장볍이 높은 영역이기도 하고, 이론도 수학 & 통계를 기본으로 다루고 있어, 접근하기가 쉽지 않은 분야인건 확실합니다. 그럼에도 방법만 알면, 누군가 가이드 해준다면 도전해볼 의지가 있는 분들에게 조금이나마 길라잡이 역할을 해드리고자 이 포스팅을 작성해봅니다.
저도 처음에 어떻게 방향을 잡고, 뭘 해야할지 막막했는데, 한 책을 발견하고 어느 정도 정리 할 수 있을 것 같아서 공유해보려 합니다. (참고한 책 제목은 '1년 안에 AI 빅데이터 전문가가 되는 법' 입니다)
Step1. AIㆍ빅데이터 경영서적 독파
경영서적이라고 하면 좀 의아해할 수도 있습니다. 파이썬 언어를 배워야 하는거 아니야? 선형대수학이나 수리통계학 공부해야 하는거 아니야? 라고 생각하실수도 있는데 첫 스타트로는 먼저 인공지능 기술을 통해서 비즈니스 현장에서는 어떤 문제들을 풀고 있는지, 어떻게 적용하고 있는지 확인할 필요가 있습니다.
저 개인적으로는 이 단계를 문제 인식, 문제 정의라고 생각하는데요. 머신러닝, 딥러닝 영역에서는 문제를 어떻게 바라보고, 이 문제를 어떤 방식으로 풀건지 정의하고, 사고하는 과정이 너무나도 중요합니다. 첫 스타트이기 때문에 여기서 바로 세우지 못하고 꼬여 버리면 모델을 열심히 구현해도 성능이 안좋거나 잘못 접근해서 처음부터 다시 해야하는 상황도 발생하기 때문입니다.
그리고 이 영역이 연구분야도 활발하지만, 워날 실용 측면의 접근도 활발하기 때문에 이 기술을 실제 산업 현장에서는 어떻게 활용하고 있는지 선행 사례를 살펴보는 게 좋습니다.
그럼 어떤 경영서적을 읽으면 좋을지 소개해드리겠습니다.
▶ 『빅데이터 기초 : 개념, 동인, 기법』(시그마프레스) - 빅데이터 관련 개념 중점
▶ 『인공지능 시대의 비즈니스 전략』(더퀘스트) - AI 관련 개념 중점
▶ 『빅데이터가 만드는 제4차 산업혁명』(북카라반) - 실제 산업 현장에서 빅데이터 비즈니스 활용 사례
▶ 『빅데이터 비즈니스 이해와 활용』(위즈하임) - 실제 산업 현장에서 빅데이터 비즈니스 활용 사례
▶ 『빅데이터 분석과 활용』(학지사) - 실제 산업 현장에서 빅데이터 비즈니스 활용 사례
실제 비즈니스에서 마주하는 문제들을 어떻게 풀어내는지 어떤 데이터로, 어떻게 접근하는지 확인하고, 성과가 잘 나온 사례들을 적용해서 새롭게 현재 마주한 문제들을 해결할 수 있습니다.
Step2. 기본 머신러닝 알고리즘
비즈니스 현장에서 적용 사례를 확인하고 실전 적용을 위한 기본기라고 생각하시면 좋습니다. 머신러닝에는 크게 지도학습, 비지도학습, 강화학습으로 나뉘고 지도학습에서는 회귀, 분류 비지도학습에서는 군집 등 다양한 종류와 방법으로 나뉩니다.
이러한 개념들을 익히고, 실제 프로그래밍으로 어떻게 구현하는지, 그 원리는 무엇인지 대략적으로 알고 있어도 실전에 적용하는데 큰 문제가 없습니다. 요즘 대세는 파이썬이기도 하고, 관련 라이브러리와 프레임워크가 잘 돼 있기 때문에 파이썬으로 시작하시는걸 추천드립니다.
기본적으로 숙지해야 할 내용들을 소개하자면
① 데이터 이해 : 데이터의 유형(명목, 이진, 순서, 이산형, 범주형 데이터) / 기술통계(평균, 표준편차 등)
② 데이터 전처리 : 결측치 제거 및 보간, 노이즈 제거, 정규화(데이터 범주 일치), 주성분분석, 샘플링 등
③ 알고리즘 : 상관관계, 연관관계, 클래스 분류(의사결정나무, 랜덤포레스트), 클러스터, 회귀 분석 등
위 내용이 어렵게 느껴질수도 있는데, 완벽히 암기하고, 완벽히 이해해서 내것으로 만들겠다는 접근보다는 전반적으로 어떤 개념이고, 어떤 내용인지 이해하고, 파악하고, 필요한 내용을 보고 따라서 구현할 수 있을정도의 실력까지 키우면 좋을 듯 싶습니다.
그럼 내용을 익히는 데 도움이 되는 책을 소개해드리겠습니다.
▶ 『데이터 마이닝 개념과 기법』(에이콘출판) - 각 알고리즘 동작 원리 이해 쉬움
▶ 『패턴인식』(교보문고) - 알고리즘의 수학적 설명 서술
▶ 『데이터 마이닝 기법과 응용』(한나래) - 알고리즘의 수학적 설명 서술
위 책을 활용해서 전반적인 데이터에 대한 개념과 처리, 알고리즘의 프로세스를 익히고, 이 개념들을 실제 현장 비즈니스에서 어떻게 사용하고 있는데 디테일하게 확인하는 게 좋습니다. 이 때 살펴보는 게 논문입니다.
<추천 논문 저널>
국내
▶ 『지능정보연구』
▶ 『한국경영과학회지』
▶ 『Information System Review』
국외
▶ 『IEEE Access』
▶ 『IEEE Transactions on Big Data』
▶ 『Information System Research』
Step3 수리 통계학
수리통계학을 공부해야 하는 이유는 우리가 사용하는 알고리즘에 대한 튜닝이 필요할 때, 좀 더 데이터와 문제에 맞는 방향으로 세팅하기 위해서 기본적인 이해가 바탕돼 있어야 하기 때문입니다. 수학적인 이론과 개념을 증명하고, 풀어야할 필요는 없고, 이해하는 선에서 익히는 방향을 추천드립니다.
<책 추천>
▶ 『수리통계학 개론』(경문사) - 수리통계학의 정석
<공부 방법>
1. 책 읽다가 수식 나오면 따라 적고, 이해해본다.
2. 이해가 안되면 구글링, 유튜브 등 인터넷을 활용해서 이해해본다.
3. 이해가 안되면 넘어간다.
4. 각 챕터별 연습문제는 해답을 보면서 이해해 보고, 해설과 정답을 적어본다. (증명이나 유도 문제는 건너띈다)
Step4. 딥러닝
딥러닝은 머신러닝의 한 종류다. 이 개념부터 시작해서, Neural Network의 개념, 오차역전파 등 다양한 개념을 익히고, 이런 이론과 개념을 어떻게 코드로 적용하는 지 숙지하는 과정이 중요하다.
<책 추천>
▶ 『딥러닝 제대로 시작하기』(제이펍) - 딥러닝의 기본 개념 정리
▶ 『밑바닥부터 시작하는 딥러닝』(한빛미디어) - 딥러닝 심화 & 기본 코드 내용까지 다룸
▶ 『케라스 창시자에게 배우는 딥러닝』(길벗) - 실전 딥러닝 모델 구현
<강의 추천>
▶ 『모두의 딥러닝 시즌1』 - https://youtu.be/BS6O0zOGX4E?list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm
▶ 『모두의 딥러닝 시즌2』 - https://youtu.be/qPMeuL2LIqY?list=PLQ28Nx3M4Jrguyuwg4xe9d9t2XE639e5C
책과 강의를 통해 기본기를 잘 다지길 추천드립니다.
Tip. 관심 가져볼만한 자격증
한 가지 유의할 점은 자격증이 목적이 아니라 실력 상승이 목적입니다. 즉, 자격증은 안따도 사실 괜찮습니다. 물론 기왕 공부하는 김에 자격증도 따는게 좋긴 하겠지만, 무튼 우리의 목적은 실력입니다. 단순히 자격증을 따기 위한 시험에 맞춘 공부가 아니라 실력 상승을 위한 공부임을 명심하시길 바랍니다.
<자격증 소개>
[책에서 소개하는 자격증]
▶ 데이터 분석 자격검정 - 한국데이터 산업 진흥원
▶ SQL 자격검정 - 한국데이터 산업 진흥원
▶ 사회조사분석사 필기 - 한국산업인력공단
▶ 경영빅데이터분석사 - 한국경제
[추가]
▶ 정보처리기사 - 한국산업인력공단
▶ 빅데이터 분석 기사 - 한국데이터 산업 진흥원
<자격증 공부를 위한 책 추천>
▶ 『데이터 분석 전문가 가이드』 for '데이터 분석 자격검정'
▶ 『경영 빅데이터 분석사』 for '경영 빅데이터 분석사'
▶ 『SQL 전문가 가이드』 for 'SQL 자격검정'
자격증과 공부에 필요한 책들을 간략히 추천드렸습니다. 자격증은 오랜 기간 보다는 단기간에 집중해서 취득하는 것을 추천드리고, 그만큼 내용을 깊게 보는 것이 아니라 전반적인 흐름과 개념을 잡는다는 생각으로 빠르게 공부하시길 추천드립니다.
그리고 SQL 자격검정 시험에서는 데이터 모델링, 기본적인 SQL 쿼리 부분을 중점으로 숙지하는 게 도움이 됩니다.
그럼 지금까지 AI 머신러닝/딥러닝 성장 루트 및 가이드, 공부법에 대한 소개를 마치겠습니다. 감사합니다.
'AI > MachineLearning' 카테고리의 다른 글
Pytorch #3 - pytorch 연산 (0) | 2023.01.09 |
---|---|
Pytorch #2 - pytorch 차원 (0) | 2023.01.05 |
Pytorch #1 - pytorch 기본 지식 및 기초 확인 (0) | 2022.12.27 |
Pre-course 부스트캠프AI 3기 - ep.01 머신러닝 히스토리 (0) | 2021.12.10 |