Post

Ontology Constrained Generation of Domain-specific Clinical Summaries

Ontology를 Input Augmentation이 아닌 Generation Constraint로 활용한 case의 논문입니다.

Ontology Constrained Generation of Domain-specific Clinical Summaries

 이 포스팅은 25년도 광주과학기술원(GIST) 석사과정을 진행하는 제 연구 주제와 관련된 논문 리뷰 및 정리글입니다.


0.

  • 학회 및 컨퍼런스: Knowledge Engineering and Knowledge Management(EKAW) 2024
  • 수행기관: 캐나다 Montreal Polytech 대학교

1. Introduction & Background

  • Summarization:

  • 의료 도메인에서의 Summarization: EHR

2. Methodology

Desktop View 전체 프레임워크

  1. 각 의학과에 맞는 DCF 사전 구축
  2. 환자의 EHR을 CSR로 변환
  3. CSR을 목적에 맞는 DCF를 이용해 Pruning
  4. Pruning된 CSR을 그대로 사용하거나, LLM을 통해 Verbalize.
  • Dataset: MIMIC-III
  • Ontology: SNOMED-CT

2 - 1) DCF 작성

DCF(Domain-Class Frequency)는 특정 의학과와 관련이 높은 온톨로지 클래스들의 집합을 각 클래스의 빈도수(관련도 점수)와 함께 정리한 Dictionary 형태의 데이터 구조를 말한다.

Desktop View 도메인과 클래스의 관계. 특정 도메인과 관련된 온톨로지끼리 모여있다는 보장이 없으며, connectivity는 온톨로지를 어떻게 설계하느냐에 따라 다름. 따라서 어떤 도메인에 어떤 클래스가 연관된 개념인지는 직접 텍스트를 통해 정리해야 함

온톨로지 안에서 어떤 클래스들이 특정 도메인과 연관이 깊은지 미리 정리해두면, 이 정보를 통해 나중에 도메인에 맞게 중요한 클래스만을 필터링이 가능해진다.

2 - 2) CSR 작성

CSR(Class-Summarization Frequency)은

This post is licensed under CC BY 4.0 by the author.