Posts
기록
Cancel

Instacart dataset EDA project 00. instarcart 개요 ‘식품계의 우버’라 불리는 미국의 신선식품 대발 서비스 스타트업으로, 국내의 마켓컬리와 유사하다. instarcart는 월마트, 세이프웨이, 코스트코 등 대형마트부터 지역의 슈퍼마켓의 제품을 대신 구매하여 배달하여 주는 서비스를 제공한다. 설립 2년만...

1. About Database 1.1 DB Database의 약자 데이터를 통합하여 관리하는 데이터의 집합 1.2 DBMS Database Management System의 약자 데이터베이스를 관리하는 미들웨어 시스템을 데이터베이스 관리시스템이라고 함 1.3 RDBMS Relational Database Ma...

1. 독립과 상관 1.1 독립과 상관은? 상관 : 표본값이 달라지면 다른 확률변수의 조건부 분포가 달라지는것 독립 : 두 확률변수가 상관관계가 아닐때 두 확률변수 X,Y의 결합확률밀도함수가 주변확률밀도함수의 곱과 강으면 서로 독립 1.2 반복 시행 같은 확률변수에서 복수의 표본 데이터를 취하는 경우에는 이 표본들은 서...

1.확률적 데이터와 확률변수 1.1 확률적 데이터 결정론적 데이터 : 항상 같은 값이 나오는 데이터 확률적 데이터 : 정확히 예측할 수 없는 값이 나오는 데이터 결합확률 : 사건 A와 B가 동시에 발생할 확률 1.2분포 확률적 데이터에서 어떠한 값이 자주 나오고, 어떠한 값이 드물게 나오는가를 나타내는 정보 카운트 플롯...

1. 결합확률과 조건부 확률 1.1 결합확률(Joint Probabilit) 사건 A와 B가 동시에 발생할 확률 P(A,B) 1.2 주변확률(Marginal Probability) 결합확률과 대비되는 개념으로 결합되지 않는 개별 사건의 확률 P(A) or P(B) 1.3 조건부확률(Conditional Probabi...

1. 확률의 수학적 정의와 의미 1.2 표본공간과 확률표본 확률표본(표본) : 확률적 문제에서 발생할수 있는 하나의 현상 표본공간 : 가능한 모든 표본의 집합, 어떤 표본이 가능하고 어떤 표본이 가능하지 않는가를 정의하는 것 1.3 사건 표본공간의 부분집합, 전체 표본공간 중에서 우리가 관심을 가지는 일부 표본의 집합 ~ 가 ...

1. 변분법 1.1 범함수 함수를 입력받아 실수를 출력하는 것 1.2 변분법 입력인 함수가 변할때 범함수의 출력이 어떻게 달라지는지 계산하는 학문 2. 최적화 기초 2.1 최적화 문제 함수 f의 값을 최대화 혹은 최소화 하는 변수 x값 x*를 찾는 것 해 : x*의 최적화 문제 목적함수 : 최소화하려는 함수 f...

1. sympy를 사용한 함수 미분 1.1예측 모형의 성능 성능함수 : 모수를 결정하여 성능을 측정하는 함수 손실함수 : 오차(e)가 가장 작아지는 함수 목적함수 : 최적화의 대상이 되는 모든 함수 (성능, 손실, 오차) 최적화 : 목적 함수를 가장 크거나 작게 만드는 함수 미분 : 입력값이 변했을때 출력값이 어떻게 변하는지 ...

1. PCA와 함수 1.1 PCA 주성분 분석, 차원축소 잠재변수를 찾는것 잠재변수란 측정되지는 않았지만 측정된 데이터의 기저에 숨어서 측정 데이터를 결정 짓는 변수 1.2 PCA의 수학적 설명 데이터가 원점을 중심으로 존재하는 경우에는 벡터에 변환행렬...

1. Git, Bash Command 1.1 Bash command ’$ ls’ 현재 폴더의 리스트 확인 ’$ ls -a’ 숨김파일까지 보기 ’$ ls -l’ 파일 모두 보기 ’$ cd’ 폴더 이동 ’$ cd ..’ 상위 폴더로 이동 .. ’$ rm’ 파일 삭제 ’$ rm_r’ 파일 모두 삭제 ’$ clear’ 프롬프트 ...