전체기사

2025.04.23 (수)

  • 맑음동두천 21.1℃
  • 구름조금강릉 11.7℃
  • 맑음서울 21.9℃
  • 구름많음대전 21.7℃
  • 구름조금대구 17.8℃
  • 구름많음울산 11.8℃
  • 구름많음광주 19.3℃
  • 구름많음부산 13.9℃
  • 구름많음고창 15.7℃
  • 흐림제주 16.3℃
  • 맑음강화 17.7℃
  • 구름조금보은 21.8℃
  • 맑음금산 20.1℃
  • 구름많음강진군 16.3℃
  • 흐림경주시 13.6℃
  • 흐림거제 13.4℃
기상청 제공

e-biz

셀렉트스타, 1억 3천만건 AI 학습데이터 구축 프로젝트 분석 결과 발표

URL복사

한국어 데이터셋 진화 중, 초개인화 추천 연구개발 활발

 

[시사뉴스 김남규 기자] 셀렉트스타가 인공지능(AI) 학습데이터 구축 트렌드를 담은 ‘셀렉트스타 인공지능 인사이트’를 9일 발표했다.

 

인공지능 학습데이터 플랫폼인 셀렉트스타는 지난 2018년부터 올해 상반기까지 약 5년간 14개 분야의 데이터를 수집·가공했다. 프로젝트 금액이 큰 순으로 보자면, ▲언어(40.2%) 카테고리가 가장 컸다. 이어서 ▲뷰티(6.4%) ▲예술(5.6%) ▲사람(5.3%) ▲건강(4.4%) ▲동물(4%) ▲자동차(3.8%) ▲식품(3.7%) 순이었다.

 

셀렉트스타가 발표한 인사이트 자료에 따르면, 언어 데이터는 주로 자연어 처리(NLP)나 자연어 이해(NLU)에 활용됐다. NLP와 NLU는 스마트 어시스턴트, 음성 인식, 검색 결과, 언어 번역, 텍스트 분석, 키워드 분석 등 활용 범위가 넓은 것이 특징이다. 한편 초기 AI가 단순하게 문구 또는 문서를 인식했다면, 이제는 사람의 감정이나 특징(사투리, 악플 등)까지 파악이 가능하다고 셀렉트스타 측은 설명했다. 음성 AI도 초기에는 단순히 언어를 인식하는 것에서 출발했지만, 이제는 인식에서 나아가 사람의 감정을 읽거나 표현하는 단계로 진화하고 있다.

 

2020년 전후로 AI 기반 초개인화 기술의 연구개발도 활발해졌다. 시장의 중심이 판매자에서 구매자로 옮겨갔고 온라인 구매가 증가하면서 추천, 고급 검색, 채굴, 매칭 알고리즘 등 초개인화 AI 개발과 고도화를 위한 학습용 데이터 수집·가공의 필요성이 커졌다. 특히 AI 기술 기반으로 시장에 뛰어든 스타트업이 늘어나면서 다양한 분야의 학습데이터가 구축되고 있다. 예컨대 셀렉트스타는 ▲개인 취향 맞춤 의류 추천 AI를 위한 의류 및 패션 이미지 태깅 데이터셋 ▲소비자 만족도 분석 AI를 위한 상품 리뷰 데이터셋 ▲음악 리뷰에 대한 감정 태깅 데이터셋 ▲건강 관리 AI를 위한 홍채 이미지 라벨링 데이터셋 ▲코로나19 시대 안면 인식을 위한 마스크 착용 사진 수집 및 라벨링 데이터셋 등을 구축한 바 있다. 다만 현재까지 국내 시장은 PoC(기술검증) 형태의 시도가 중심인데, 이는 서비스나 사업의 성공에서 ‘AI 성능’ 보다는 다른 요인의 영향이 비교적 크기 때문이라는 게 셀렉트스타의 분석이다.

 

신호욱 셀렉트스타 대표는 “셀렉트스타는 인공지능을 개발하는데 필수적인 ‘정확하고 일관된 학습데이터’를 생산하는 회사이면서 200개 이상의 타사와 협업을 통해 어떤 회사에서 어떤 인공지능을 만드는지 파악할 수 있기 때문에 이번 인사이트 자료를 발표할 수 있었다”고 설명했다. 이어 “AI 성능 향상은 데이터의 생산 및 관리 수준 규모와 비례한다”며 “AI Transformation이 전 세계적인 트렌드인 만큼 국내 AI 시장의 잠재력도 높다”고 강조했다.

 

셀렉트스타 인공지능 인사이트에 대한 자세한 내용과 파일 다운로드는 셀렉트스타 공식 블로그에서 확인 가능하다.

저작권자 Ⓒ시사뉴스
제보가 세상을 바꿉니다.
sisa3228@hanmail.net





커버&이슈

더보기
서울 봉천동 아파트 화재 7명 사상, 방화 용의자는 현장서 사망
[시사뉴스 홍경의 기자] 서울 관악구 봉천동에서 21일 오전 발생한 화재로 인하여 1명이 사망하고 6명이 중·경상을 입었다. 화재를 낸 것으로 추정되는 방화 용의자는 현장 사망자와 동일인인 것으로 확인됐다. 서울경찰청에 따르면 이날 봉천동에서 발생한 방화 용의자는 60대 남성으로 복도에서 발견된 소사체와 동일인이다. 서울경찰청 관계자는 "불에 탄 변사체의 지문을 확인해본 결과 방화 용의자로 추정하던 사람과 동일인으로 보인다"고 밝혔다. 방화 용의자는 인화물질 액체를 담을 수 있는 토치 형태의 도구로 아파트에 불을 지른 것으로 확인됐다. 아파트 인근에서는 해당 도구로 불을 지르는 모습이 포착되기도 했다. 방화 전에는 본인이 거주하던 주거지에 유서를 남겼다. 현장에 남겨진 유서에는 "엄마 미안하다"는 내용과 함께 딸에게는 "할머니 잘 모셔라"는 내용을 남겼다. 아울러 "이 돈은 병원비하라"며 유서와 함께 현금 5만원을 놓아뒀다. 한편 소방당국은 이날 오전 8시17분께 봉천동 소재 21층 규모의 아파트 4층에서 화재가 발생했다는 신고를 접수하고 출동했다. 화재 연속 확대와 인명 피해 우려에 8시30분 대응 1단계를 발령했으며, 소방 인원 153대와 소방차 45대

정치

더보기
이재명, '공공의대 설립' 공약 발표...공공·필수·지역 의료 인력 양성
[시사뉴스 홍경의 기자] 이재명 더불어민주당 대선 경선 후보가 '공공의대 설립' 공약을 내놓았다. 문재인 정부 시절 추진했다가 의료계 반발로 무산됐던 정책인만큼, 공공의대를 둘러싼 의정 갈등이 되풀이되는 것 아니냐는 우려가 나온다. 23일 국회 등에 따르면 이 후보는 지난 22일 페이스북에 "공공의대를 설립해 공공·필수·지역 의료 인력을 양성하고 디지털 인프라를 기반으로 한 차세대 공공의료시스템을 갖춘 공공병원을 확충해 가겠다"고 밝혔다. 6·3 조기 대선이 40여일 앞으로 다가온 가운데 나온 이재명 후보의 공약은 응급·분만·외상치료 등 필수의료를 국가가 책임지는 시스템을 만들겠다는 구상이다. 윤석열 정부에서 사회적 갈등 요인으로 급부상한 '의대 증원'은 속도 조절을 예고했다. 전공의와 의대생 등을 포함한 의료계, 환자, 시민단체 등 모든 이해당사자가 참여하는 사회적 합의를 통해 의대 정원을 결정하겠다는 취지다. 앞서 윤 전 대통령은 지난해 2월 의대 정원을 2000명 늘리겠다고 발표했고, 이에 전공의들의 수련병원 이탈, 의대생들의 수업 거부 등 1년 2개월째 의료계와 정부가 대립하고 있다. 이에 이 대표는 의대 증원 가능성은 열어두면서도 '사회적 합의'를

경제

더보기

사회

더보기
‘양악수술 후 내 모습’ 미리 보여주는 AI 모델 개발
[시사뉴스 이용만 기자] ‘양악수술을 받은 뒤의 내 모습은?’ 인공지능(AI)을 활용해 양악수술 후의 모습을 미리 보여주는 방사선 영상을 생성하는 기술이 최근 개발됐다. 악교정수술(양악수술)은 안면 골격 이상을 교정하거나 외상으로 인해 변형된 턱뼈를 재배열하는 수술로 미용 목적으로도 많이 시행되고 있다. 하지만 환자마다 부정교합의 정도가 다르기 때문에 수술 계획을 세우고 결과를 예측하는 데 어려움이 있었다. 서울아산병원 융합의학과 김남국, 치과 성상진·김윤지 교수팀은 양악수술 전 환자의 해부학적 구조 데이터를 분석하고 이를 기반으로 수술 후 모습을 예측해 고해상도의 측면 두부 방사선 영상을 생성하는 AI 모델을 개발했다고 밝혔다. 이번 AI 모델의 정확도를 검증한 결과, 연구에 참여한 교정 전문의와 구강악안면외과 전문의들은 AI가 생성한 예측 영상과 실제 수술 후 촬영한 영상을 구분하지 못했으며, 두 영상에 표시된 해부학적 기준점(계측점) 간의 평균 오차는 대부분 1.5mm 이하일 정도로 매우 높은 정확도를 보인 것으로 나타났다. 이번 연구는 향후 의료현장에서 AI를 이용해 양악수술의 결과를 미리 예측하고, 이를 근거로 개별 환자에게 적합한 수술 계획을 세우

문화

더보기

오피니언

더보기