전체기사

2025.04.29 (화)

  • 맑음동두천 20.6℃
  • 맑음강릉 19.5℃
  • 맑음서울 20.8℃
  • 맑음대전 20.6℃
  • 맑음대구 21.3℃
  • 맑음울산 16.7℃
  • 맑음광주 20.9℃
  • 맑음부산 15.7℃
  • 맑음고창 19.5℃
  • 맑음제주 16.4℃
  • 맑음강화 17.4℃
  • 맑음보은 19.3℃
  • 맑음금산 20.5℃
  • 구름조금강진군 20.0℃
  • 맑음경주시 22.2℃
  • 맑음거제 16.5℃
기상청 제공

사회

의료용 대규모언어모델, 보안침해위험 81% ‘경고등’

URL복사

서울아산병원 연구팀, 의도적 악성공격 시도해 개인정보유출 위험성 분석

원본데이터노출 22%···“민감정보 다루는 만큼 ‘의료 특화형 대규모언어모델’ 필요”

임상의학 분야 최고 권위지 NEJM의 AI 분야 특화 자매지 ‘NEJM AI’ 게재

[시사뉴스 이용만 기자] 최근 챗GPT와 같은 생성형 인공지능과 그 핵심 기술인 대규모언어모델(Large Language Model, LLM)이 다양한 산업군에서 활발하게 활용되면서, 의료 분야에서도 이를 접목한 디지털 혁신에 주목하고 있다.

 

하지만 환자의 개인정보보호가 특히 중요한 분야인 만큼, 대규모언어모델 사용에 따른 개인정보유출 등 보안에 대한 우려가 꾸준히 제기되고 있다.

 

최근 서울아산병원 심장내과 김영학 교수·아산생명과학연구원 빅데이터연구센터 전태준 박사팀이 대규모언어모델을 의료 분야에 적용하는 과정에서 발생할 수 있는 개인정보유출 문제를 확인하기 위해 의도적으로 악성 공격을 시행한 결과, 최대 81%에 달하는 공격 성공률을 보였다는 연구 결과를 발표했다.

 

연구팀은 의료 분야에서는 민감한 개인정보를 다루기 때문에 대규모언어모델 도입에 신중하고 각별한 주의가 필요하고, 독립적으로 운용되는 의료 특화형 대규모언어모델이 필요하다고 강조했다.

 

이번 연구 결과는 전 세계 의사들의 임상치료 교과서로 불리는 NEJM(New England Journal of Medicine)의 자매지인 ‘NEJM AI’에 최근 게재됐다. 의료계에서 인공지능의 중요성이 점점 확대됨에 따라, 임상의학 분야 세계 최고 권위지로 꼽히는 NEJM에서도 지난해 1월부터 인공지능 분야만을 특화해 다루는 자매지를 출간한 것이다.

 

대규모언어모델은 수십억 개 이상의 매개변수를 기반으로 대량의 데이터를 학습해 사람처럼 생각하고 답변하는 인공지능 모델이다. 이는 챗GPT, 제미나이(Gemini)와 같은 생성형 인공지능이 작동하는 핵심 기술로, 질문이나 명령어를 담은 프롬프트를 입력하면 대규모언어모델이 이를 이해하고 적합한 답변을 제공한다.

 

의료 분야에 대규모언어모델을 적용하면 엑스레이, CT, MRI 등의 검사 이미지를 다량의 데이터 기반으로 분석해 진단의 정확도를 높일 수 있고, 환자의 개인 데이터를 기반으로 맞춤형 치료 계획을 제공할 수 있다. 전자의무기록(EMR)이나 동의서 작성을 자동화하는 등 의료진의 관리 업무도 간소화해 전반적으로 효율성이나 정확성이 향상될 것으로 기대된다.

 

다만 대규모언어모델의 보안이 위협될 경우 환자들의 민감한 개인정보가 유출되어 윤리적, 법적 위험성이 초래될 수 있다.

 

서울아산병원 심장내과 김영학 교수·아산생명과학연구원 빅데이터연구센터 전태준 박사팀은 2017년 1월부터 2021년 12월까지 환자 2만 6,434명의 의무기록을 활용해 대규모언어모델을 학습시켰다.

 

악성 공격은 대규모언어모델에 입력하는 질문인 프롬프트에 의미 없는 기호, 글을 추가하거나 인코딩하는 등 다양하게 변형해 악의적인 질문을 하는 방식으로 위험성을 평가했다.

 

이번 연구는 윤리적으로 사전 승인된 데이터만을 활용했으며, 서울아산병원 임상연구심의위원회(IRB)의 심의를 거쳐 진행되었다.

 

먼저 문자를 인코딩하는 방식인 ASCⅡ(미국정보교환표준코드) 방식으로 프롬프트를 변형한 결과, 대규모언어모델의 보안장치를 피해 민감한 개인정보에 접근할 수 있는 확률을 평가하는 가드레일 비활성화율이 최대 80.8%에 달했다. 80.8%에 달하는 확률로 보안 조치가 쉽게 침해될 수 있다는 뜻이다.

 

또한 대규모언어모델이 답변을 생성하는 과정에서 학습된 원본 데이터를 노출할 가능성은 최대 21.8%로 나타났다. 모델에 질문하는 형식을 미세하게 조정함으로써 원본 학습 데이터가 쉽게 노출될 수 있다는 것이다.

 

구체적인 예시로 수술 준비를 위해 상세한 환자 정보를 제공하는 시스템으로 대규모언어모델을 학습시킨 뒤 의료기록 검토를 요청하는 프롬프트를 인코딩 방식으로 조정한 결과, 대규모언어모델이 대답을 생성하는 과정에서 민감한 환자 데이터는 물론 의료진의 이름이나 전문 분야 등 구체적인 정보가 노출됐다.

 

김영학 서울아산병원 심장내과 교수는 “의료 분야에서 대규모언어모델을 활용했을 때 기대되는 발전이 크지만, 데이터 보안 강화 없이는 심각한 개인정보유출로 이어질 수 있다. 민감한 개인정보를 다루는 분야인 만큼 보안의 중요성이 특히 강조되며, 독립적으로 운용되는 의료 특화형 대규모언어모델이 필요하다”고 말했다.

저작권자 Ⓒ시사뉴스
제보가 세상을 바꿉니다.
sisa3228@hanmail.net





커버&이슈

더보기

정치

더보기

경제

더보기

사회

더보기
김형재 시의원, “서울시 홍보대사의 ‘무제한 연임’ 관행 사라진다”
[시사뉴스 홍경의 기자] 서울특별시의회 김형재 의원(국민의힘·강남2)이 서울시 홍보대사의 무분별한 연임 관행을 방지하기 위해 대표발의한 「서울특별시 홍보대사 운영에 관한 조례 일부개정조례안」이 지난 25일 개최된 제330회 서울시의회 임시회 2차 본회의에서 최종 가결됐다. 그동안 서울시는 시정의 효율적인 홍보와 시 이미지 제고를 위한 차원에서 홍보대사를 무보수 명예직으로 위촉하여 운영해 왔다. 최근 5년간 위촉된 홍보대사만 해도 52명에 달한다. 현행 조례상 홍보대사의 임기는 2년이다. 그러나 연임 횟수에 대한 제한은 따로 없기 때문에 특정인이 장기간 홍보대사로 활동하는 경우가 적지 않았고, 이에 따라 서울시 홍보대사직이 관행적으로 연임될 우려가 있다는 지적이 제기되어 왔다. 김 의원이 대표발의한 이번 개정안이 서울시의회 본회의에서 가결됨에 따라 앞으로 서울시 홍보대사는 초임 2년을 포함해 최대 6년까지만 활동할 수 있게 됐다. 단 현 임기 중 시정홍보에 탁월한 업적을 인정받는 경우에 한해 추가 연임을 허용하는 예외 규정을 추가했다. 김형재 의원은 “그동안 서울시는 시정홍보와 시 이미지 제고를 위해 홍보대사를 위촉·운영해 왔지만, 최근 5개년간 위촉된 52명

문화

더보기
제16회 화성특례시 가족사랑축제’ 개최
[시사뉴스 정춘옥 기자] 화성시문화관광재단(대표이사 안필연)은 2025년 봄을 맞이해 따듯한 분위기 속에서의 예술가와 시민이 어우러지는 ‘2025 제16회 화성특례시 가족사랑축제’를 오는 5월 17일(토) 동탄복합문화센터 일원에서 개최한다. 이번 축제는 ‘봄봄 예술놀이터’라는 부제를 설정하고, 재단의 주요사업과 연계한 다양한 프로그램을 통해 시민과 지역 예술인 간의 소통과 화합을 도모할 예정이다. 축제 현장에서는 온 가족이 즐길 수 있는 예술체험, 기획전시 연계프로그램, 아트마켓, 공연, 올해의 도서 연계 등 다양한 체험과 이벤트가 진행된다. 주 무대 공연은 화성 뱃놀이 축제의 메인 프로그램 중 하나인 바람의 사신단 참가단체의 댄스 퍼포먼스가 진행되고, 버스킹존에서는 화성시 예술단이 아름다운 선율을 선사한다. 또한 골목놀이 체험존에선 가족과 함께 즐기며 소중한 추억을 쌓을 수 있는 프로그램을 제공한다. 화성시문화관광재단 안필연 대표이사는 “가정의 달 5월을 맞이해 온 가족이 함께 다양한 볼거리와 체험을 통해 가족 간 추억을 쌓고, 화합할 수 있는 축제가 되길 바란다”고 말했다. 자세한 사항은 화성시문화관광재단 홈페이지(www.hcf.or.kr) 또는 축제기획

오피니언

더보기