Python 3

[통계/Python] ANOVA & 사후검정, ADP 실기 29회 풀이

⬇️ 더 많은 ANOVA 자료와 코드는 깃허브에서 볼 수 있습니다 ! ⬇️ https://github.com/Minju-nimm/ADP/blob/master/Statistics/8_ANOVA.ipynb [ One-way ANOVA ] 개념 인자, 요인 (factor) : 학년과 같이 모집단의 그룹을 구분하는데 사용되는 변량을 그룹 또는 인자(factor)라고 하는데 대부분 이산형 변량이다. 수준(level) : 인자가 가지는 값들을 인자의 수준(level)이라고 하며, 이들 수준의 개수가 비교되는 모집단의 개수가 된다. 이와 같이 하나의 인자가 반응변량에 미치는 영향을 조사하는 분산분석법을 일원분산분석(one-way ANOVA)이라 한다. 예시 어느 대학에서 각 학년별 도서관 평균이용시간이 같은가? 세 ..

📊 Statistics 2023.08.19

[통계/Python] 맥니마 검정(McNemar's test) 개념 및 예제, ADP 실기 28회 풀이

[ 맥니마 검정(McNemar's test) ] 목적 : 2개의 대응 표본을 가지고 범주형 변수의 분포가 변화했는지 검정 짝지은(paired) 범주형 데이터의 2x2 분할표가 있을 때, Column과 Row의 주변확률(marginal probability)가 같은지 검정 paied, 연관 : 동일인에 대해 두 번 측정하거나, 부모-자식처럼 관련있는 사람들에 대해 측정 즉, 범주형 변수가 2개일 때 쓸 수 있는 방법 맥네마 검정은 분할표에서 각 관측치 간에 독립성이 만족하지 않을 때 사용하는 검정 독립성 : 두 변수가 서로 영향을 주지 않는 상황. 두 변수 간에 아무런 상관관계가 없다는 뜻 머신러닝에서는 2x2 혼동행렬에 대한 예측모델의 정확도를 비교하는 방법으로도 사용 가설 검정통계량 검정 통계량은 카이..

📊 Statistics 2023.08.15

[Python] 대용량 csv 데이터 불러오기 : dask

공모전을 준비하면서 4GB가 넘는 건축물대장 파일을 전처리할 필요가 있었는데, 데이터베이스를 연결하지않고 파이썬 내에서 간단하게 불러올 수 있는 dask라는 라이브러리가 있어서 유용하게 사용했던 적이 있다. dask 라이브러리 병렬 처리를 지원하는 대규모 데이터프레임 라이브러리 큰 규모의 데이터를 효율적으로 처리하고 분석할 수 있도록 도와줌 Pandas와 비슷한 API를 제공하여 기존에 Pandas를 사용했던 사람들도 비교적 쉽게 적용 가능 코드별 설명 Raw data : https://open.eais.go.kr/opnsvc/opnSvcInqireView.do 에서 다운로드 가능 상황 : 2023년 5월 기준 전국 건축물대장 층별개요 데이터에서 서울특별시 & 필요 칼럼만 추출 1. 라이브러리 및 필요 ..

카테고리 없음 2023.07.27
728x90