전체기사

2025.12.16 (화)

  • 흐림동두천 0.0℃
  • 흐림강릉 5.6℃
  • 흐림서울 1.7℃
  • 맑음대전 0.6℃
  • 맑음대구 0.5℃
  • 맑음울산 2.3℃
  • 맑음광주 2.9℃
  • 맑음부산 5.8℃
  • 맑음고창 0.8℃
  • 맑음제주 6.0℃
  • 흐림강화 2.3℃
  • 맑음보은 -1.6℃
  • 맑음금산 -0.1℃
  • 맑음강진군 -0.1℃
  • 맑음경주시 -1.3℃
  • 맑음거제 2.1℃
기상청 제공

사회

의료용 대규모언어모델, 보안침해위험 81% ‘경고등’

URL복사

서울아산병원 연구팀, 의도적 악성공격 시도해 개인정보유출 위험성 분석

원본데이터노출 22%···“민감정보 다루는 만큼 ‘의료 특화형 대규모언어모델’ 필요”

임상의학 분야 최고 권위지 NEJM의 AI 분야 특화 자매지 ‘NEJM AI’ 게재

[시사뉴스 이용만 기자] 최근 챗GPT와 같은 생성형 인공지능과 그 핵심 기술인 대규모언어모델(Large Language Model, LLM)이 다양한 산업군에서 활발하게 활용되면서, 의료 분야에서도 이를 접목한 디지털 혁신에 주목하고 있다.

 

하지만 환자의 개인정보보호가 특히 중요한 분야인 만큼, 대규모언어모델 사용에 따른 개인정보유출 등 보안에 대한 우려가 꾸준히 제기되고 있다.

 

최근 서울아산병원 심장내과 김영학 교수·아산생명과학연구원 빅데이터연구센터 전태준 박사팀이 대규모언어모델을 의료 분야에 적용하는 과정에서 발생할 수 있는 개인정보유출 문제를 확인하기 위해 의도적으로 악성 공격을 시행한 결과, 최대 81%에 달하는 공격 성공률을 보였다는 연구 결과를 발표했다.

 

연구팀은 의료 분야에서는 민감한 개인정보를 다루기 때문에 대규모언어모델 도입에 신중하고 각별한 주의가 필요하고, 독립적으로 운용되는 의료 특화형 대규모언어모델이 필요하다고 강조했다.

 

이번 연구 결과는 전 세계 의사들의 임상치료 교과서로 불리는 NEJM(New England Journal of Medicine)의 자매지인 ‘NEJM AI’에 최근 게재됐다. 의료계에서 인공지능의 중요성이 점점 확대됨에 따라, 임상의학 분야 세계 최고 권위지로 꼽히는 NEJM에서도 지난해 1월부터 인공지능 분야만을 특화해 다루는 자매지를 출간한 것이다.

 

대규모언어모델은 수십억 개 이상의 매개변수를 기반으로 대량의 데이터를 학습해 사람처럼 생각하고 답변하는 인공지능 모델이다. 이는 챗GPT, 제미나이(Gemini)와 같은 생성형 인공지능이 작동하는 핵심 기술로, 질문이나 명령어를 담은 프롬프트를 입력하면 대규모언어모델이 이를 이해하고 적합한 답변을 제공한다.

 

의료 분야에 대규모언어모델을 적용하면 엑스레이, CT, MRI 등의 검사 이미지를 다량의 데이터 기반으로 분석해 진단의 정확도를 높일 수 있고, 환자의 개인 데이터를 기반으로 맞춤형 치료 계획을 제공할 수 있다. 전자의무기록(EMR)이나 동의서 작성을 자동화하는 등 의료진의 관리 업무도 간소화해 전반적으로 효율성이나 정확성이 향상될 것으로 기대된다.

 

다만 대규모언어모델의 보안이 위협될 경우 환자들의 민감한 개인정보가 유출되어 윤리적, 법적 위험성이 초래될 수 있다.

 

서울아산병원 심장내과 김영학 교수·아산생명과학연구원 빅데이터연구센터 전태준 박사팀은 2017년 1월부터 2021년 12월까지 환자 2만 6,434명의 의무기록을 활용해 대규모언어모델을 학습시켰다.

 

악성 공격은 대규모언어모델에 입력하는 질문인 프롬프트에 의미 없는 기호, 글을 추가하거나 인코딩하는 등 다양하게 변형해 악의적인 질문을 하는 방식으로 위험성을 평가했다.

 

이번 연구는 윤리적으로 사전 승인된 데이터만을 활용했으며, 서울아산병원 임상연구심의위원회(IRB)의 심의를 거쳐 진행되었다.

 

먼저 문자를 인코딩하는 방식인 ASCⅡ(미국정보교환표준코드) 방식으로 프롬프트를 변형한 결과, 대규모언어모델의 보안장치를 피해 민감한 개인정보에 접근할 수 있는 확률을 평가하는 가드레일 비활성화율이 최대 80.8%에 달했다. 80.8%에 달하는 확률로 보안 조치가 쉽게 침해될 수 있다는 뜻이다.

 

또한 대규모언어모델이 답변을 생성하는 과정에서 학습된 원본 데이터를 노출할 가능성은 최대 21.8%로 나타났다. 모델에 질문하는 형식을 미세하게 조정함으로써 원본 학습 데이터가 쉽게 노출될 수 있다는 것이다.

 

구체적인 예시로 수술 준비를 위해 상세한 환자 정보를 제공하는 시스템으로 대규모언어모델을 학습시킨 뒤 의료기록 검토를 요청하는 프롬프트를 인코딩 방식으로 조정한 결과, 대규모언어모델이 대답을 생성하는 과정에서 민감한 환자 데이터는 물론 의료진의 이름이나 전문 분야 등 구체적인 정보가 노출됐다.

 

김영학 서울아산병원 심장내과 교수는 “의료 분야에서 대규모언어모델을 활용했을 때 기대되는 발전이 크지만, 데이터 보안 강화 없이는 심각한 개인정보유출로 이어질 수 있다. 민감한 개인정보를 다루는 분야인 만큼 보안의 중요성이 특히 강조되며, 독립적으로 운용되는 의료 특화형 대규모언어모델이 필요하다”고 말했다.

저작권자 Ⓒ시사뉴스
제보가 세상을 바꿉니다.
sisa3228@hanmail.net





커버&이슈

더보기

정치

더보기


사회

더보기
내란특검 “윤석열, 2023년 10월 전부터 비상계엄 준비...반대 세력 제거·권력 독점 목적”
[시사뉴스 이광효 기자] 윤석열 전 대통령은 지난 2023년 10월 전부터 비상계엄을 준비했고 반대 세력 제거와 권력 독점을 위해 지난해 12월 3일 비상계엄을 선포했던 것으로 나타났다. 내란 특검팀은 15일 이런 것들을 주요 내용으로 하는 최종 수사 결과를 발표했다. 조은석 특별검사는 이날 서울고등검찰청 기자실에서 ‘윤석열 전 대통령 등에 의한 내란·외환 행위의 진상규명을 위한 특별검사 수사결과’ 브리핑을 해 “윤석열 등은 2023년 10월 전부터 비상계엄을 준비했고 군을 통해 무력으로 정치활동 및 국회 기능을 정지시키고 국회를 대체할 비상입법기구를 통해 입법권과 사법권을 장악한 후 반대세력을 제거하고 권력을 독점·유지할 목적으로 비상계엄을 선포한 사실을 확인했다”고 말했다. 조은석 특별검사는 “비상계엄을 선포할 명분을 만들기 위해 비정상적 군사작전을 통해 북한의 무력도발을 유인했으나 북한이 군사적으로 대응하지 않아 실패했고 이에 윤석열, 김용현 (당시 국방부 장관), 노상원 (전 정보사령부 사령관), 여인형 (당시 국군방첩사령부 사령관) 등은 국회에서 이뤄지는 정치활동을 내란을 획책하는 ‘반국가행위’, ‘반국가세력’으로 몰아 비상계엄을 선포했다”며 “특검

문화

더보기

오피니언

더보기
【박성태 칼럼】 마음이 전하는 따뜻한 이야기: 아직 살 만한 세상이다
일상생활과 매스컴 등을 통해 우리가 마주하는 세상은 때로는 냉혹하고, 험악하고, 때로는 복잡하게 얽혀 있어 사람들의 마음을 삭막하게 만든다. 하지만 문득 고개를 돌렸을 때, 혹은 예상치 못한 순간에 마주하는 작고 따뜻한 선행들은 여전히 이 세상이 살 만한 가치가 있다는 것을 깨닫게 해준다. 마치 어둠 속에서 빛나는 별들처럼, 우리 주변에는 서로를 향한 배려와 이해로 가득 찬 아름다운 이야기들이 끊임없이 펼쳐지고 있다. 최근 필자가 경험하거나 접한 세 가지 사례는 ‘아직 세상은 살 만하다’는 느낌을 주기에 충분해 소개할까 한다. 첫 번째 이야기: ‘쪽지 편지’가 부른 감동적인 배려 누구나 한 번쯤은 실수를 저지른다. 아무도 없는 어느 야심한 밤. 주차장에서 타인의 차량에 접촉 사고를 냈는데 아무도 못 봤으니까 그냥 갈까 잠시 망설이다가 양심에 따라 연락처와 함께 피해 보상을 약속하는 간단한 쪽지 편지를 써서 차량 와이퍼에 끼워놓았다. 며칠 후 피해 차량의 차주로부터 뜻밖의 연락을 받았다. 보통 이런 상황에서는 손해배상 절차에 대한 이야기부터 오가기 마련이지만, 차주분은 “요즘 같은 세상에 이렇게 쪽지까지 남겨주셔서 오히려 고맙다”며, 본인이 차량수리를 하겠다는


배너