

<aside> 💡
python
numpy
sklearn
pandas
matplotlib, seaborn
Decision Tree
RandomForest
Light BGM
AdaBoost
XGBoost
사용자가 입력한 질병변수와 상관관계가 높은 n개의 컬럼(원인) 중 기준치를 초과하는 경우, 그 컬럼들이 입력한 질병에 걸린 환자군에서 차지하는 비율을 계산합니다. 이를 기반으로 정상인 중 잠재적 환자를 예측하고, 중증질환의 예방 및 조기 대응을 가능하게 합니다. 이를 통해 질병에 영향을 미치는 주요 원인을 분석하고, 중증질환 예방 및 골든타임 확보 등 보건의료 분야의 연구에 기여할 수 있습니다.

고혈압, 당뇨병, 뇌졸중과 같은 주요 질환을 분석 및 예측하여, 각 질병 변수와 상관관계가 높은 요인들을 기반으로 잠재적 환자를 식별할 수 있었습니다. 또한, 질병변수 별로 가장 높은 정확도를 가진 예측 모델을 선정하고 이를 Rank로 도출해, 각 질병 변수에 가장 적합한 모델을 적용하도록 구현하였습니다.