분류 전체보기 104

[모두의 딥러닝]#2-4. 가장 훌륭한 예측선

결국 머신러닝에서 기본이 되는 것은 '선형회귀' 와 '로지스틱회귀'. (물론 이 외에 다른 기본기가 여러개 있긴함) 무언가를 예측하기 위한 방정식을 풀어나가는 과정이기 때문에 그 방정식을 다양한 관점에서 풀 수 있는 방법을 단순 선형회귀에서부터 로지스틱회귀까지 딥러닝 기법을 사용해가면 될 것 같다. 문과 석사 쓸모없는 줄 알았는데, 그래도 통계 열심히 배워두길 잘한 듯 ... 과거의 나야 잘햇다 ... #2. 예측 모델의 기본 원리 - 4. 가장 훌륭한 예측선 딥러닝을 포함한 머신러닝의 예측은 결국 기존 데이터(정보)를 가지고 어떤 선이 그려질 지 예측한 후, 아직 답이 나오지 않은 그 무언가를 그 선에 대입해 보는 것. [최소 제곱법] 주어진 데이터를 가장 잘 설명할 수 있는 가장 정확한 선을 구하기 ..

[모두의 딥러닝] #1-3. 딥러닝을 위한 기초 수학

개괄적으로 머신러닝에 필요한 수학 기초를 훑고나서, 그동안 안써서 까먹은 파이썬 기초를 복습했다. 회사에서 데이터 다룰 때엔 csv 바탕으로 일하다보니 데이터 전처리만 간단하게 하고 끝냈어서...데이터프레임만 주구장창 썼지 set이나 dict를 거의 쓸 일이 없었는데 머신러닝 학습 시 볼 예제들을 보니까 이제 이걸 자주 써야겠다...싶었다. ❣️ 참고. 빨리 복습하고 싶었는데, 찾아보니 아래 링크에서 괜찮은 강의 + 실습파일이 꽤 있었음. https://aib.oopy.io/aibprecourse 파이썬 복습을 끝낸 이후, 드디어 유명한 모두의 딥러닝을 읽게 되었다 야호! 다만 #1,#2장은 기본적인 내용들이라 간단하게 따라하고 넘기는게 가능했기에 정리는 하지 않고 또...기본 수학부터 다시 정리해보려 ..

[머신러닝을 위한 수학 with 파이썬, R] #7. 선형 회귀 분석과 모형 확장

#7. 선형 회귀 분석과 모형 확장 [분석의 목적] 추론 : 과거를 이해하기 위함 (선형 회귀 분석) 예측 : 미래를 알아보기 위함 (딥러닝) [선형 회귀 분석] 기본 개념 선형 회귀란 주어진 데이터를 설명하기 위해 Y절편과 기울기로 나타낸 직선을 적합시키는 과정 적합시키기 위해 잔차(예측값과 실제값의 차이)의 제곱을 모두 다한 잔차제곱합이 최소가 되게 하는 직선 (최소제곱법) 잔차 확률 분포에 대한 가정 잔차가 모든 같은 분산을 갖는 정규 분포를 따른다 (등분산성, 정규성) 종속변수와 독립변수가 선형성을 갖는다 다중 선형 회귀 분석 독립 변수 간 다중공선성을 주의해야 함 (서로 상관) 직선 모형이 데이터를 얼마나 잘 설명하고 있는 지 검정을 해야 함 모형에 대한 검정 (결정계수, R**2) 전체 제곱합..

[머신러닝을 위한 수학 with 파이썬, R] #6. 상관분석과 분산분석

#5. 상관분석과 분산분석 ※ 내용 중 아는 내용은 모두 건너뛰고 기억해야 할 개념 및 수식 위주로 정리 상관분석 상관분석의 가설 귀무가설(H0) : p = 0 (상관관계가 없다) 대립가설(H1) : p =/ 1 (있다) 상관계수 : 두 변수의 공분산을 각 변수의 표준편차로 나눈 일종의 표준화된 공분산의 개념. 공분산을 -1~1 사이로 변환한 것 분산분석 일원분산분석 x가 집단(범주형), 해당 집단에서 평균을 구하고자 하는 값(y값들)이 수치형 y로 나타나며 y의 평균을 x의 요인별로 구해서 비교하는 것. 어렵게 설명했는데, 결국 A, B,C집단에서 측정하고자 하는 값의 평균을 비교하고 싶닼!!! 인거 개별 관측값인 y값들은 결국 속한 집단의 평균 + 오차로 구성됨. 이때의 오차는 서로 독립이며 정규분포..

[머신러닝을 위한 수학 with 파이썬, R] #5. 확률분포와 통계적 추론

더보기 🐍👣 분명히..석사시절 (n년전) 투스텝와이즈 리그레션 모델을...돌리면서 통계를 마스터 했다 생각했는데.. 다시봐도..새롭고...지금봐도...새로운...통계와..수식의 세계... #4. 확률분포와 통계적 추론 ※ 확통 내용 중 기본적으로 알 만한 내용은 모두 건너뛰고 기억해야 할 개념 및 수식 위주로 정리 확률 변수와 확률 분포 표본 공간 : 얻을 수 있는 값의 총 집합 확률 변수 : 표본 공간의 각 값에 실수를 부여하는 함수 확률 분포 : 확률 변수가 취할 수 있는 모든 값에 대해 이들 값이 취할 수 있는 확률을 나타낸 것 확률 분포 함수 : 확률 변수에 대응되는 확률의 관계를 함수로 나타낸 것 항상 양의 값을 가진다 표본 공간 안에 있는 전체 event의 확률을 합치면 1이 된다 이산형 확률..

[머신러닝을 위한 수학 with 파이썬, R] #4. 확률과 통계

더보기 🐍👣 배우지 않았던 선형대수와 미적분을 3일에 걸쳐서 끝낸 이유일까... 확통? 완전 자쉰있쯰~~~라고 했지만 수식만 보면 겁에 질리는 사람 그 사람이 바로 나에요 시그마 너무 공격적으로 생김; #4. 확률과 통계 ※ 확통 내용 중 기본적으로 알 만한 내용은 모두 건너뛰고 기억해야 할 개념 및 수식 위주로 정리 분산 : 각 관측값이 평균에서 얼마나 퍼져있는 지를 보는 척도 표본분산 : 표본에서 얻은 분산 모분산과 달리 n-1을 분모로 사용하는 이유는 분산을 계산할 때 모평균이 아닌 표본 평균을 사용했기 때문에 모집단의 편의 추정량(biased estimator)이 되므로, 분산이 불편 추정량(unbiased estimator)이 되도록 하기 위해서이다 [위키백과] 표준편차 각 관측값이 평균과 대체..

[머신러닝을 위한 수학 with 파이썬, R] #3. 미분과 적분의 이해와 응용

더보기 🐍👣 라떼는 말이죠...문과가 미적분을 안배웠던 시절이었읍니다.... 개념이나 사용하는 수식 자체가 어렵진 않은데 그 개념과 수식을 도출하기까지의 과정을 이해하자니 한권의 책으론 역부족이었다. (현재 보고 있는 책은 그닥 친절하지 않았다) 이에 나중에 보려고 했던 미분적분 책을 병행하면서 겨우 개념과 수식을 이해했는데, 과연 이걸 내가 직접 어떻게 쓸 수 있을지는 두고봐야겠따 흑흑...그냥 빨리 딥러닝 배우고 싶다 흑흑... #3. 미분과 적분의 이해와 응용 (feat. [Book] 다시 미분 적분) [미적분을 위한 사전 지식] 합성함수 : f(x)를 '특정 날짜의 판매량'을 알 수 있는 함수, g(x)를 '판매량에 따른 영업이익'을 알 수 있는 함수 라고 가정했을 때 특정 날의 영업이익을 알고자..

특기는 입사, 취미는 퇴사 #1. 세번째 퇴사를 앞둔 감회

내 나이 3n살 지금까지 회사 경력 약 6년, 회사를 두번 퇴사했고 세번째 퇴사를 앞두고 있다. 입사는 6번 정도 했는데, 보통 바로 다른 회사 합격이 되었기 때문에 사실상의 입사는 세번이라고 보는 것이 맞겠다. 이번 퇴사는 그동안의 퇴사와는 성격이 다르다. 그동안은 더 가고 싶었던 회사로 이직했기 때문에 퇴사를 했는데 이번 퇴사는 더 배우고 싶기 때문에 퇴사를 결심했다. 학석사를 합치면 10년 넘게 A 라는 일에 종사해오고 있었다. A라는 일 자체가 의미있고 뿌듯하긴 하지만 앞으로 내가 50,60 넘어서까지 계속 A라는 일을 할 수 있을 지 미래가 불투명해 보였다. 현재 회사에서 A라는 업무를 가치있게 평가해주는 편도 아니고, 언젠간 외국에 나가 사는 것을 생각하는 내게 A라는 업무는 전혀 매력적이지가..

[머신러닝을 위한 수학 with 파이썬, R] #2. 머신 러닝을 위한 선형 대수 part2. 고윳값, 고유벡터, 대각화

더보기 🐍👣 ㅎ ㅏ... 행렬 자신 있따고 썼던 지난 글의 나는 어디에,,,? 개념적으로 이해가 될랑가말랑가 하다가 대충 감이 잡힐랑가 말랑가 하는 중임 지금은 억지로 꾸겨 넣는 중... 나중에 선대 책 보면서 더 잘 이해 할거라고 믿어 의심치 않아 미래의 나야 화이팅~ ^^! #2. 머신러닝을 위한 선형 대수 Background : 왜 대각화를 해야 하는가? - 마르코프 체인에서 전이 행렬을 거듭 제곱 x 무한대 하다 보면 아래와 같은 문제가 발생함 ㄴ 10,000개의 상태 (10,000개의 행과 열)을 가진 행렬일 경우 계산량이 많아짐 - 하지만 행렬 내에 0이 많다면 쉽게 곱셈하여 문제를 해결할 수 있음 - 전이 행렬을 거듭 제곱해야 하는 상황에서 대각화를 이용하면 보다 쉽게 계산이 가능함 대각화(..

[커리큘럼]문과생 60일만에 AI 정복하기 같은 대충 식상한 제목 (23.04.13 update)

오늘은...1월 26일.. 내 퇴사는...(아마) 3월 20일...근데 좀 더 빨리 할까 고민 중. 3월 6일쯤? 놓칠수 없어요 주휴수당 ~ 내 수술은...3월 14일... AI 코스웤 시작은 4월 18일... 내게 남은 시간 단 11주 - 1주(수술 1주) = 10주 앞으로 10주 간 학습해야 할 내용은 우선 아래와 같음 TRACK1. 기본기 다지기 [MUST] 꼭... 다 이해해야 함...책 다 읽고 소화하기... 1. 머신러닝을 위한 수학 with 파이썬, R 2. 모두의 딥러닝 3. 다시 미분 적분 4. 알고리즘 구현으로 배우는 선형대수 5. 프로그래머를 위한 확률과 통계 [NICE] 하면 좋음 6. 파이썬 머신러닝 완벽가이드 --여기는 AI 코스웤 시작하고 병행하면서 봐도됨-- 7. 딥러닝 파이..