Cited 0 times in
Deep learning based hypertension estimation via 1-Lead ECG and PPG waveform
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | 윤, 덕용 | - |
dc.contributor.author | 박, 찬민 | - |
dc.date.accessioned | 2021-11-10T05:51:59Z | - |
dc.date.available | 2021-11-10T05:51:59Z | - |
dc.date.issued | 2021 | - |
dc.identifier.uri | http://repository.ajou.ac.kr/handle/201003/19781 | - |
dc.description.abstract | 심혈관 질환은 전 세계 주요 사망 원인 중 하나이며, 고혈압은 심혈관 질환의 대표적인 위험 요소이다. 순간적인 혈압 상승, 또는 장기간 지속된 높은 혈압은 뇌졸중과 심장 마비, 심부전의 위험을 증가시키는 것으로 알려져 있다. 중환자실에서도 혈압은 환자의 상태를 대변하는 대표적인 활력 징후이고 혈압이 크게 상승하는 것을 조기에 발견하고, 적절한 중재를 취하는 것이 중환자실에서의 환자 예후에 도움이 된다. 고혈압을 조기에 발견하기 위해서는 혈압의 연속적인 모니터링이 요구되지만 현재 지배적인 혈압 측정 방식은 커프를 이용한 혈압 측정 방식으로 연속적인 혈압 측정에는 제한이 있으며 카테터를 이용한 동맥 혈압 측정 방식은 견고한 혈압 측정을 제공하지만 감염의 위험이 있다. 최근 디지털 센서와 신호 처리 기법의 발전으로 스마트폰, 스마트 디바이스 등을 이용한 생체신호 측정이 가능하게 되었고 이와 더불어 인공지능, 기계학습, 딥 러닝 기술의 발달은 이러한 생체 신호로부터 특징을 추출하고 임상적인 지표를 예측하는 것을 가능케 만들었다. 심혈관 시스템으로부터 파생되는 두 신호인 광혈류측정(Photoplethysmography, PPG) 데이터와 심전도(Electrocardiogram, ECG) 데이터는 심장의 운동에 따라 다양한 임상적인 정보를 포함하는 것으로 알려져 있고 이들 신호를 통한 비침습적인 방식의 혈압 추정 연구는 과거로부터 다양하게 시도 되었다. 이전의 연구들은 연구자의 엔지니어링 기법에 의한 매개 변수 추출 방식을 주로 사용하거나, 적은 피험자를 대상으로 한 연구가 대부분이었다. 딥 러닝 기술이 혈압 추정 방식에 적합한 기술인지 평가하기 위해서는 더 큰 규모의 데이터를 통해 검증하는 과정이 요구된다. 본 연구에서는 이전 연구들과 비교해 더 큰 규모의 피험자를 대상으로 생체 신호로부터 혈압을 추정하는 딥 러닝 모델을 구축하여 그 성능을 평가하고자 한다. 일반적으로 고혈압은 혈압이 높게 유지되는 만성 질환을 의미하지만 본 연구에서 ‘고혈압’ 이란 중환자실에서 환자의 혈압이 일시적으로 상승한 상태를 의미한다. 본 연구에 활용된 데이터베이스는 아주대학교 병원 중환자실 생체신호 데이터베이스이며, 2020년 11월 기준으로 29,379명의 환자 데이터를 포함하며 총 데이터의 규모는 1,730,808,513행에 해당하는 데이터가 존재한다. 생체 신호 데이터베이스로부터 수집 시간이 완전히 일치된 PPG와 ECG 두 파형 데이터를 추출하고 이와 동일한 시간에 수집된 혈압 데이터를 병합하였다. 각각의 파형에 대해서 해당 시간의 환자가 고혈압 상태였는지, 정상 혈압을 가진 상태였는지 라벨링을 실시하였다. 총 네 가지의 상태로 라벨링 하였는데 각각 은 수축기 혈압과 이완기 혈압을 기준으로 일정 수치별로 구간을 나누어 분류하였다. 최종적인 딥 러닝 모델은 ‘정상’과 ‘고혈압’을 분류하는 이진 분류이기 때문에 모델의 분류 성능을 향상 시키기 위해 정상과 고혈압의 경계선에 존재하는 데이터(Grey zone data)에 해당하는 데이터를 연구에서 제외 하였다. 데이터 전처리는 총 4단계로 진행된다. 첫 번째 과정은 데이터 스케일링이다. 이는 각 파형 데이터의 스케일이 다를 경우 딥 러닝 모델의 학습 저해 요인이 될 수 있으므로 이를 제거해주는 과정이다 Z점수를 이용한 표준화를 실시했다.두 번째로 피크검출을 이용하여 피크가 검출되지 않는 데이터들을 제거하고 세 번째로 일정한 패턴이 나타나는 비정상 신호를 규칙 기반으로 제거하였으며 네 번째로 신호처리 기법 중 하나인 필터링을 적용하여 파형에 포함된 잡음을 제거하였다. 본 연구에서는 총 세 가지의 모델을 구축하고 그 성능을 비교 했다. 각각의 모델은 합성곱 신경망 모델을 기반으로 하는 ResNet 아키텍처로 구성하였고, 각각의 모델은 입력 데이터의 형태가 다르다. 첫 번째 모델은 입력 데이터인 PPG와 ECG를 각각 1차원 배열로 입력 받는 형태의 모델이며, 두 번째 모델은 PPG와 ECG를 2차원으로 합친 배열을 입력으로 받는 모델이며, 세 번째 모델은 1차원과 2차원 파형 데이터를 모두 입력 데이터로 활용한 모델이다. 모델의 성능 평가 결과 세 번째 모델이 가장 뛰어난 분류 성능을 보였다. F1-score는 0.68를 달성하고, 0.69의 분류 정확도를 달성하고 0.70의 정밀도와 0.69의 재현율을 달성했으며 모델의 AUROC 값은 0.762에 해당한다. 다른 두 모델은 이에 미치지 못하는 성능 지표를 보여줬는데 이는 ECG와 PPG가 2차원 배열로 합친 입력 값을 통해 합성곱신경망이 추가적인 정보를 학습한 것으로 판단된다. 이전까지의 고혈압 추정 연구에 관한 연구들은 입력 변수의 선정과 사용한 모델의 구조에 초점이 맞춰져 있었다. 하지만 본 연구에서는 입력 데이터의 형태에 따라서 모델의 성능이 달라지는 것을 보였다. 분석에 있어서 입력 데이터의 길이와 형태, 데이터의 조합 등을 다양하게 실험함으로 최적의 조합을 찾아내는 것 또한 고성능의 모델을 만들어 내는데에 필요하다는 것을 증명했다. | - |
dc.description.tableofcontents | I. 서 론 1
A. 연구 배경 1 B. 관련 연구 3 C. 연구 목적 5 II. 연구 대상 및 방법 6 A. 연구 설계 6 B. 데이터 수집 8 1. 데이터베이스 8 2. 연구 대상자 및 데이터 추출 10 3. 데이터 라벨링 12 C. 데이터 전처리 14 1. 데이터 스케일링 14 2. 피크 검출 15 3. 패턴이 나타나는 비정상 신호 제거 16 4. 필터링 17 D. 혈압 추정 모델 및 성능 평가 18 1. 합성곱 신경망 18 2. 고혈압 추정 모델 21 3. 입력 데이터 형태 23 4. 성능 평가 25 E. 개발 환경 및 라이브러리 27 1. 개발환경 27 2. 라이브러리 목록 28 III. 결과 29 A. 데이터 추출 29 1. 데이터 분포 29 B. 데이터 전처리 31 1. 데이터 스케일링 31 2. 피크 검출 32 3. 파형 데이터 필터링 33 C. 고혈압 추정 모델 34 1. 모델 구축 결과 34 2. 성능 평가 35 3. ROC Curve 36 IV. 고찰 37 V. 결론 41 VI. 참고 문헌 42 | - |
dc.language.iso | ko | - |
dc.title | Deep learning based hypertension estimation via 1-Lead ECG and PPG waveform | - |
dc.title.alternative | 1-Lead 심전도 및 광혈류측정 파형을 통한 딥 러닝 기반 고혈압 추정 연구 | - |
dc.type | Thesis | - |
dc.identifier.url | http://dcoll.ajou.ac.kr:9080/dcollection/jsp/common/DcLoOrgPer.jsp?sItemId=000000030670 | - |
dc.description.degree | Master | - |
dc.contributor.department | 대학원 의학과 | - |
dc.contributor.affiliatedAuthor | 박, 찬민 | - |
dc.date.awarded | 2021 | - |
dc.type.local | Theses | - |
dc.citation.date | 2021 | - |
dc.embargo.liftdate | 9999-12-31 | - |
dc.embargo.terms | 9999-12-31 | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.