📊 Statistics 7

[통계/개념] p-value란 대체 무엇인가? (+ 유의수준)

p-value의 정의 귀무가설이 참이라는 가정 하에, 계산된 검정 통계량이 귀무가설을 얼마나 지지하는지 나타내는 확률 (p-value가 작음 → 귀무가설이 참일 확률이 적어짐) 확률이기에 0~1로 표준화된 지표 p-value가 작으면 귀무가설이 참일 확률이 적어진다. 하지만 얼마나 작아야 '통계적'으로 작다고 할 수 있을까? 통상적으로 0.05(혹은 0.01)보다 작으면 귀무가설이 참일 확률이 매우 작다고 판단한다. 검정통계량 : 귀무가설이 참이라는 가정 아래 얻은 통계량 더보기 귀무가설(H0)이 참일 때, 관측된 결과 또는 더 극단적인 결과를 얻을 확률 귀무가설이 옳다는 가정하에, 검정통계량이 이론적으로 따르는 표집분포상에서 표본에 기반한 검정통계량보다 더 극단적인 확률을 말한다. 표본에 기반한 검정통..

📊 Statistics 2023.09.16

[통계/Python] 이표본 비율 검정, ADP 실기 29회 풀이

⬇️ 더 많은 자료와 코드는 깃허브에서 볼 수 있습니다 ! ⬇️ https://github.com/Minju-nimm/ADP/blob/master/Statistics/5_%EB%B9%84%EC%9C%A8_%EC%B6%94%EC%A0%95_%EA%B2%80%EC%A0%95.ipynb 이표본 모비율 검정은 두 비율이 같은지, 차이가 있는지를 보는 방법이다. 개념과 예시를 통해 자세히 알아보자. 예시 1) 금년도 대통령 선거에서 특정후보에 대한 지지율에 유권자의 성별에 따른 차이가 있는가? 2) 어느 공장에서 제품을 만들어 내는 두 대의 기계가 있는데 두 기계의 불량률이 서로 다른가? 신뢰구간 검정통계량 1) 표본비율을 이용한 검정통계량 신뢰구간에 사용되는 방법과 같음 표본비율을 이용한 검정통계량, 공통비율을..

📊 Statistics 2023.08.26

[통계/Python] ANOVA & 사후검정, ADP 실기 29회 풀이

⬇️ 더 많은 ANOVA 자료와 코드는 깃허브에서 볼 수 있습니다 ! ⬇️ https://github.com/Minju-nimm/ADP/blob/master/Statistics/8_ANOVA.ipynb [ One-way ANOVA ] 개념 인자, 요인 (factor) : 학년과 같이 모집단의 그룹을 구분하는데 사용되는 변량을 그룹 또는 인자(factor)라고 하는데 대부분 이산형 변량이다. 수준(level) : 인자가 가지는 값들을 인자의 수준(level)이라고 하며, 이들 수준의 개수가 비교되는 모집단의 개수가 된다. 이와 같이 하나의 인자가 반응변량에 미치는 영향을 조사하는 분산분석법을 일원분산분석(one-way ANOVA)이라 한다. 예시 어느 대학에서 각 학년별 도서관 평균이용시간이 같은가? 세 ..

📊 Statistics 2023.08.19

[통계/Python] 맥니마 검정(McNemar's test) 개념 및 예제, ADP 실기 28회 풀이

[ 맥니마 검정(McNemar's test) ] 목적 : 2개의 대응 표본을 가지고 범주형 변수의 분포가 변화했는지 검정 짝지은(paired) 범주형 데이터의 2x2 분할표가 있을 때, Column과 Row의 주변확률(marginal probability)가 같은지 검정 paied, 연관 : 동일인에 대해 두 번 측정하거나, 부모-자식처럼 관련있는 사람들에 대해 측정 즉, 범주형 변수가 2개일 때 쓸 수 있는 방법 맥네마 검정은 분할표에서 각 관측치 간에 독립성이 만족하지 않을 때 사용하는 검정 독립성 : 두 변수가 서로 영향을 주지 않는 상황. 두 변수 간에 아무런 상관관계가 없다는 뜻 머신러닝에서는 2x2 혼동행렬에 대한 예측모델의 정확도를 비교하는 방법으로도 사용 가설 검정통계량 검정 통계량은 카이..

📊 Statistics 2023.08.15

[통계/Python] 음이항분포(Negative Binomial Distribution) 개념 및 예제

[ 음이항분포(Negative Binomial Distribution) ] 음이항분포는 $x$번의 베르누이 시행에서 $k$번째 성공할 때까지 계속 시행하는 실험에서의 확률을 나타내는 이산확률분포이다. 전체 x번 시행에서 생각해보면, $x-1$까지 $k-1$개의 성공이 있어야한다. 이 경우, 실패의 갯수는 $(x-1)-(k-1)=x-k$ 음이항분포는 보통 $X \sim NB(k,p)$ 라고 표기한다. 확률질량함수 성공확률이 $p$인 베르누이 시행을 독립적으로 반복할 때, $k$개의 성공을 얻을 때까지 필요한 시행횟수를 $X$라고 하면 음이항분포 Example 1 7회의 동일한 게임으로 구성된 경기에서 두 개의 팀 A와 B가 겨루게 되었다고 하자. 4회를 먼저 이기는 팀이 우승을 하게 되고, 어떤 팀이든지 ..

📊 Statistics 2023.08.12

[통계/Python] 다항분포(Multinomial Distribution) 개념 및 예제

[ 다항분포(Multinomial Distribution) ] 여러 개의 독립 확률변수들에 대한 확률분포로, 여러 번의 독립적 시행에서 각 사건(확률변수)에 따라 특정 횟수가 나타날 확률을 정의하는 분포이다. 독립 확률변수가 여러 개? : 독립적으로 서로 다른 여러 개의 사건 또는 범주가 존재한다는 것을 의미 이항분포의 확장이라고 볼 수 있다. 동전을 N번 던져 '앞면'이 나오는 횟수의 분포가 이항 분포 주사위를 N번 던져 '각 면'이 나오는 횟수 집합의 분포가 다항분포 이항분포는 앞면이라는 성공 횟수에 초점을 두고, 다항분포는 하나가 아닌 여러'집합'의 분포에 초점을 둔다. 카테고리가 $k$개인 카테고리 확률변수의 표본 데이터를 $N$개 얻었을 때, 각각의 카테고리 $k(k=1, \cdot \cdot ..

📊 Statistics 2023.08.08

[통계/R] 베이지안 회귀 기초 개념 & ADP 실기 26회 R 구현

통계학을 공부하면서 가장 어려운 개념이라고 생각하는 베이지안. ADP 실기가 베이즈 관련 개념들을 많이 출제하는 것 같아서 나름 공부한 내용을 포스팅하기로 했다. 더 공부하면서 지속적으로 포스팅 수정할 계획. 베이지안은 접할수록 쉽지 않은 개념이다. 이렇게 정리를 해도 온전히 내 것으로 만들지 못했다.. 갈길이 멀다. ㅠㅠ 어렵지만 그만큼 흥미로운 분야라고 생각한다. 복습하고 많이 접할수록 언젠간 더 가까워지지 않을까.. [ 베이지안 회귀 ] 확률론적인 방법을 이용하여 회귀분석을 수행하는 방법 베이지안 회귀는 베이즈 정리를 기반으로 사전 확률분포에서 MCMC기법에 의해 선정된 관측값을 반영하여, 사후 확률분포를 추산하는 방식 모든 관측값이 반영되었을 때 새로운 값 관측값(unobserved data) x..

📊 Statistics 2023.08.05
728x90