[뉴스투데이=김태진 기자] 정부가 ‘한국판 뉴딜’을 위해 5G 인프라를 조기 구축하고 데이터를 수집·축적·활용하는 데이터 인프라 구축을 국가적 사업으로 추진해 일자리 창출에 나선다. 이에 맞춰 각 부처가 사업안을 제시했으며, 과학기술정통부는 인공지능(AI) 학습 데이터 구축안을 기획재정부에 제출했다.
과기부의 사업안이 시행될 경우, 과거부터 AI 학습용 데이터를 구축해온 LG CNS(대표 김영섭)와 삼성SDS(대표 홍원표)가 한국판 뉴딜의 핵심인 데이터인프라 구축의 선두주자로 부상할지에 관심이 쏠리고 있다.
■ 과기부, AI 학습 데이터 구축 사업에 방점
한국판 뉴딜은 △데이터·5G·AI 등 디지털 인프라 구축 △비대면 산업 집중 육성 △사회간접자본(SOC) 디지털화 등 3대 영역 프로젝트를 중심으로 2~3년간 집중 추진한다는 내용이 골자다.
과기부 빅데이터진흥과 관계자는 “한국판 뉴딜에는 많은 것들이 들어 있다”며 “저희 부처에서는 AI 용으로 학습할 수 있는 데이터 구축 사업안을 기재부에 제출했다”고 설명했다. 기재부는 각 부처의 사업안을 심의 및 협의한다.
과기부의 뉴딜 사업안은 이전 프로젝트의 확장인 것으로 분석된다. 앞서 과기부는 AI 개발에 필수적인 양질의 AI 데이터를 구축해 개방하는 ‘AI 학습용 데이터 사업 공모’를 지난 3월20일에 시작한 바 있다. 올해 예산은 390억원으로, 공모 분야는 중점데이터 구축과 혁신적인 수요기반의 데이터 구축이 각 10종이다.
이 관계자는 “AI 학습 데이터 구축을 위해 딥러닝 등 데이터를 가공하는 기업들 쪽의 인력을 활용할 예정이다”고 말했다. 각 부처와 정부가 프로젝트를 확정하고 공모를 통해 기업을 선정한다. 이 때 기업이 프로젝트 진행을 위해 고용을 하면서 일자리가 창출되는 것이다.
■ 이준기 연세대 교수 “AI 학습 데이터는 모든 분야에서 활용 가능해”
딥러닝(Deep Learning)이란 인공신경망 기반의 모델로, 기계가 알아서 비정형 데이터로부터 특징 추출 및 판단까지 내리는 AI의 한 방식이다. 상위개념인 머신러닝(Machine Learning)은 전문가가 각 특성에 중요한 특징을 지정해야 하는 반면에 딥러닝은 AI가 스스로 특징을 구별하고 분류한다.
이준기 연세대 교수(전 정보대학원 원장)는 12일 본지와의 전화연결에서 “AI 학습 데이터 구축이란 꼭 사람이 사용하는 자연어만을 의미하지 않는다”며 “물론 많은 응용분야에서 사람 말을 듣고 반영하는 것은 중요하지만 자연어는 극히 일부이다”고 설명했다. AI의 활용도를 높이기 위해 자연어뿐 아니라 행동인식·시각정보·음성·언어 등의 빅데이터 구축이 필요하다는 설명이다.
이 교수는 AI 데이터 구축 활용방안에 대해 “AI는 모든 분야에서 활용되는데 예를 들어 자동차, 조선, 철강 등 전 산업에 적용된다”며 “기업 내부에서도 인사관리, 제조공정 등 모든 직무에 활용된다”고 말했다.
이처럼 정부는 AI 데이터 구축을 △번역 △상황·동작 인지 △사물·위험요소 식별 △질병 진단 데이터 등 다방면에서 활용할 계획이다.
마지막으로 이 교수는 AI 교육에 대해서도 강조했다. 모든 산업, 모든 업무에 AI가 활용될 수 있는 만큼 컴퓨터 전문가뿐 아니라 일반 대중에게도 AI 교육이 실행되어야 한다는 것이다.
■ LG CNS·삼성SDS, 방대한 데이터 구축에 AI 보건소 등 실생활 적용 / 관련 일자리 창출 기대돼
과기부의 AI 학습 데이터 구축안이 실행되면 과거부터 AI 학습 데이터 구축에 활발했던 LG CNS와 삼성SDS가 주요 파트너기업이 될 가능성이 높다. 이들 기업의 관련사업이 확대되면서 일자리 창출도 이루어질 것으로 기대되고 있다.
LG CNS는 AI를 활용한 스피커와 챗봇을 개발하는데 필수적인 AI 학습용 표준데이터 ‘코쿼드 2.0’을 지난해 9월5일 공개했다. 코쿼드 2.0은 한국어 표준데이터를 10만개를 축적하고, 단답형에서 장문 답변이 가능한 AI를 개발하도록 데이터를 강화했다.
LG CNS는 AI가 엑스레이 영상 판독 결과를 보건소에 제공하는 국내 첫 ‘AI 보건소’를 지난해 9월 선보였다. 기본 하루 걸렸던 보건소 엑스레이 판독 시간을 20초 이내로 단축시켰다. 지난 12일에는 AI 기술을 엑스레이 장비에 결합해 기업·기관의 정보 유출을 막는 ‘AI 엑스레이 영상분석’ 기술을 개발했다고 밝혔다. 저장매체 그림 5만여장 이상을 AI에 학습시켜 USB·하드디스크·메모리카드·노트북·태블릿PC·스마트폰·카메라·e북 등 8종의 저장매체 판독이 가능하며, 소요 시간은 0.3초 정도이다.
삼성SDS가 개발한 AI 자연어 이해 학습모델은 한국어 기계독해 경진대회에서 1위를 차지했다. 코쿼드2.0 깃허브 웹사이트의 기계독해 평가에 따르면, 삼성SDS는 F1 점수 86.56, EM 점수 73.51점을 기록해 참가팀 중 처음으로 ‘일반인 평균’을 능가하면서 1위를 차지했다. AI 학습 데이터 구축 수준이 월등하다는 방증이다.
삼성SDS는 기존 물류 플랫폼 ‘첼로’에 AI 빅데이터 기술을 활용했다. 첼로에 빅데이터 분석 플랫폼 브라익티스(Brightics) AI를 적용해 항만 혼잡도를 분석해 선박 도착 예정일을 화주에서 제공, 내륙 운송과 원활하게 연계해준다.