통계 3

[통계/개념] p-value란 대체 무엇인가? (+ 유의수준)

p-value의 정의 귀무가설이 참이라는 가정 하에, 계산된 검정 통계량이 귀무가설을 얼마나 지지하는지 나타내는 확률 (p-value가 작음 → 귀무가설이 참일 확률이 적어짐) 확률이기에 0~1로 표준화된 지표 p-value가 작으면 귀무가설이 참일 확률이 적어진다. 하지만 얼마나 작아야 '통계적'으로 작다고 할 수 있을까? 통상적으로 0.05(혹은 0.01)보다 작으면 귀무가설이 참일 확률이 매우 작다고 판단한다. 검정통계량 : 귀무가설이 참이라는 가정 아래 얻은 통계량 더보기 귀무가설(H0)이 참일 때, 관측된 결과 또는 더 극단적인 결과를 얻을 확률 귀무가설이 옳다는 가정하에, 검정통계량이 이론적으로 따르는 표집분포상에서 표본에 기반한 검정통계량보다 더 극단적인 확률을 말한다. 표본에 기반한 검정통..

📊 Statistics 2023.09.16

[통계/Python] 음이항분포(Negative Binomial Distribution) 개념 및 예제

[ 음이항분포(Negative Binomial Distribution) ] 음이항분포는 $x$번의 베르누이 시행에서 $k$번째 성공할 때까지 계속 시행하는 실험에서의 확률을 나타내는 이산확률분포이다. 전체 x번 시행에서 생각해보면, $x-1$까지 $k-1$개의 성공이 있어야한다. 이 경우, 실패의 갯수는 $(x-1)-(k-1)=x-k$ 음이항분포는 보통 $X \sim NB(k,p)$ 라고 표기한다. 확률질량함수 성공확률이 $p$인 베르누이 시행을 독립적으로 반복할 때, $k$개의 성공을 얻을 때까지 필요한 시행횟수를 $X$라고 하면 음이항분포 Example 1 7회의 동일한 게임으로 구성된 경기에서 두 개의 팀 A와 B가 겨루게 되었다고 하자. 4회를 먼저 이기는 팀이 우승을 하게 되고, 어떤 팀이든지 ..

📊 Statistics 2023.08.12

[통계/Python] 다항분포(Multinomial Distribution) 개념 및 예제

[ 다항분포(Multinomial Distribution) ] 여러 개의 독립 확률변수들에 대한 확률분포로, 여러 번의 독립적 시행에서 각 사건(확률변수)에 따라 특정 횟수가 나타날 확률을 정의하는 분포이다. 독립 확률변수가 여러 개? : 독립적으로 서로 다른 여러 개의 사건 또는 범주가 존재한다는 것을 의미 이항분포의 확장이라고 볼 수 있다. 동전을 N번 던져 '앞면'이 나오는 횟수의 분포가 이항 분포 주사위를 N번 던져 '각 면'이 나오는 횟수 집합의 분포가 다항분포 이항분포는 앞면이라는 성공 횟수에 초점을 두고, 다항분포는 하나가 아닌 여러'집합'의 분포에 초점을 둔다. 카테고리가 $k$개인 카테고리 확률변수의 표본 데이터를 $N$개 얻었을 때, 각각의 카테고리 $k(k=1, \cdot \cdot ..

📊 Statistics 2023.08.08
728x90