본문 바로가기
언어|프로그램 메모장/python

seaborn histplot

by 히민히 2021. 3. 8.

결국 구글코랩으로 안착...

 

 

 

구글코랩에서,

 

 

 

seaborn의 histplot을 그려보았다.

 

굉장히 많은 매개 변수들이 있다.

 

여기서 몇가지만 추려서 정리 해보기로...!

 

참고: seaborn 사이트

seaborn.pydata.org/generated/seaborn.histplot.html#seaborn.histplot

 

hue: vector or key in data

Semantic variable that is mapped to determine the color of plot elements.

 

플롯 요소의 색상을 결정하기 위해 매핑되면 의미변수! => 색조 라고 생각하면 될것 같다.

 

 

 

기본형으로 그린 형태

age에 대해 data df에 대한 히스토그램을 그려넣은것! data df는 환자의 빈혈증 여부 ... 사망여부 등 의료 기록 데이터이다.

 

위에서 hue 색조 주기 추가해 준것 .

 

death event인 생존 사망 여부에 따라 색깔을 달리 하였다.

 

 

kde는 분포를 평활하하고 플롯에 선으로 표시 하기 위해 커널 밀도 추정치를 계산하여 선을 그려줌!

 

저 거무 죽죽한 색깔이 뭔지 궁금해서 서칭해보니...

겹쳐서 색깔이 저렇게 나온것.

 

아니, 사망아니면 생존인데 겹칠 수도 있나?

 

의문이 든다....

 

 

element="step"을 넣어 좀더 보기 쉽게 step function으로 만들어주었다.

아 다시보니, 그냥 생존과 사망을 각각 그려 카운트 세준 것이네 .ㅎㅎ.. 뽈줌하다.

 

 

 

엌ㅋㅋㅋㅋㅋ후... 기억도 안나서.. 그런거야... 오랜만에 해섷...

 

 

ㅋㅋㅋ,ㅋ.ㅋㅋ.ㅋㅋ.ㅋㅋ...

 

 

 

의료 환자들을 보니 확실히 나이가 많을 수록 생존보다 사망의 확률이 굉장히 높은 것을 확인가능.

 

 

 

기록!

 

요즈음에 의료 데이터 가명으로 연구에 사용되는 것을 한국에서 허용(?) 하면서 의료 데이터를 다루는 데이터 사이언스가 엄청 성장할 거라는 이야기를 들었다.

 

 

 

메모메모

 

 

반응형

댓글