공부 정리 ( 강의 )/AI 기초

    수료!

    사실상 수료증 발급 날자를 보면 알 수 있듯, 네이버 Ai tech 합격을 위해 이미 다 수료했었던 강의이다. 하지만 수료할 당시, 맹목적적으로 가산점 및 시험 통과만을 위해서 빠르게 간력히 암기적으로 수강하였기에 머리속에 제대로 정리 되있지 않았다. MS Ai School을 수강하며 이 강의를 제대로 학습하면 도움이 될 것같아 다시한번 강의를 수강하며 정리하고 관련 문제를 풀어보았다. 생각보다 9시부터 18시까지 매일 이루어지는 MS Ai Shcool 강의와 병행하기 힘들었으나, 확실히 강의를 보고 안보고 이해도 차이가 확 느껴졌기에 어서 빨리 남은 인공지능과 관련된 부스트 코스들도 최대한 빨리 끝낼 예정이다.

    4.3.2. 통계학 맛보기

    > 모수란? - 통계적 모델링은 적절한 가정 위에서 확률분포를 추정(inference) 하는 것이 목표이며, 기계학습과 통계학이 공통적으로 추구하는 목표입니다. - 그러나 유한한 개수의 데이터만 관찰해서 모집단의 분포를 정확하게 알아낸다는 것은 불가능하므로, 근사적으로 확률분포를 추정할 수 밖에 없습니다. - 데이터가 특정 확률분포를 따른다고 선험적으로(apriori) 가정한 후 그 분포를 결정하는 모수(parameter)를 추정하는 방법을 모수적(parametric)방법론이라합니다 - 특정 확률분포를 가정하지 않고 데이터에 따라 모델의 구조 및 모수의 개수가 유연하게 바뀌면 비..

    4.3.1. 파이썬 시각화 툴

    matplotlib - pyplot 객체를 사용하여 데이터를 표시 - pyplot 객체에 그래프들을 쌓은 다음 show로 flush - 최대 단점 : argument를 kwargs 받아서 고정된 argument가 없어서 alt + tab으로 확인이 어려움 - Graph는 원래 figure 객체에 생성됨 - pyplot 객체 사용시, 기본 figure에 그래프가 그려짐 figure라는 그림판안에 또 다른 그림판 만들수 있음. 여러개 그림판 그릴 수 있음! > Set color - color 속성을 사용 - Float -> 흑백, rgb, color, predefined color 사용 > Set linstyle - ls 또는 linestyle 속성 사용. c = 가 아니라 color 라고 해도 됌 >Set..

    4.2.2. 확률론 맛보기

    >확률분포는 데이터의 초상화 - 데이터 공간을 X x Y 라 표기하고 D는 데이터 공간에서 데이터를 추출하는 분포입니다. - 데이터는 확률변수로 (x,y) ~ D라 표기 -결합분포 P(x,y)는 D를 모델링합니다. - P(x)는 입력 x에 대한 주변 확률 분포로 y에 대한 정보를 주진 않습니다. - 조건부확률분포 P(x|y)는 데이터 공간에서 입력 x와 출력 y 사이의 관계를 모델링합니다. < P(..

    4.2.1. pandas 2

    Groupby - SQL groupby 명령어와 같음 - split → apply → combine 과정을 거쳐 연산 df.groupby("Team")["Points"].sum() - 한 개이상의 column을 묶을 수 있음. df.groupby([ "Team", "Year"] )["Points"].sum( ) Hierarchical index - Groupby 명령의 결과물도 결국은 dataframe - 두 개의 column으로 groupby를 할 경우, index가 두개 생성됩니다. h_index.unstack() ★ - Group으로 묶여진 데이터를 matrix형태로 전환해줍니다. > swaplevel - Index level을 변경할 수 있음 > operations - Index level 기준으..

    4.1.2. 딥러닝 학습방법 이해

    선형모델은 단순한 데이터를 해석할 때는 유용하지만 분류문제나 좀 더 복잡한 패턴의 문제를 풀 때는 예측성공률이 높지 않습니다. 이를 개선하기 위해 비선형 모델인 신경망이 등장하였습니다. 신경망의 구조와 내부에서 사용되는 softmax, 활성함수, 역전파 알고리즘에 대해 이해하도록 합니다. 딥러닝은 여러 층의 선형모델과 활성함수에 대한 합성함수로 볼 수 있으며, 이 합성함수의 그래디언트를 계산하기 위해서 연쇄법칙을 적용한 역전파 알고리즘을 사용합니다. > 소프트맥스 연산 소프트맥스(Softmax) 함수는 모델의 출력을 확률로 해석할 수 있게 변환해 주는 연산. 분류 문제를 풀 때 선형모델과 소프트맥스 함수를 결합하여 예측합니다. < softmax 함수를 통해 특정 백터를 확률 벡터로 변환할 수 있습니다. ..

    4.1.1. pandas 1

    Pandas 구조화된 데이터의 처리를 지원하는 Python 라이브러리 Python 계의 엑셀 - 고성능 Array 계산 라이브러리인 Numpy와 통합하여, 강력한 "스프레드시트"처리 기능을 제공 - 인덱싱, 연상용 함수, 전처리 함수 등을 제공 DataFrame(raw_data, columns = ['age', 'city']) : column 을 선택할 수 있음.( 시리즈를 선택할 수 있음 ) df.loc[1] : location이라고 시리즈의 인덱스 df['age'].iloc[1:] 이렇게 시리즈를 가져오고 거기에서 인덱스를 뽑을 수 있음 loc : index location ( index 이름 ) iloc : index position ( index number ) df.debt = df.age > ..

    3.2. 경사하강법

    > 미분? - 미분(differentiation)은 변수의 움직임에 따른 함수값의 변화를 측정하기 위한 도구로 최적화에서 제일 많이 사용하는 기법. 미분은 변화율의 극한(limit)로 정의합니다. 미분을 손으로 계산하려면 일일이 h -> 0 극한을 계산해야 합니다. 파이썬에선 sympy.diff를 통해 미분을 계산할 수 있습니다. > 미분을 사용하여 - 미분은 함수 f의 주어진 점 (x,f(x))에서의 접선의 기울기를 구합니다. 미분을 계산하려면 함수의 모양이 매끄러워야합니다.(연속이여야 합니다.) - 한 점에서 접선의 기울기를 알면 어느 방향으로 점을 움직여야 함수값이 증가/감소 하는지 알 수 있다. 증가시키고 싶다면 미분값을 더하고, 감소시키고 싶다면 미분값을 빼면 됩니다. ( x에 다가 ) - 미분..