[미네르바의 눈] 물류단상(物流斷想): AI 시대에 ‘돈’ 되는 화물운송 데이터
[기사요약]
역동적인 물류, 엄청난 양의 데이터 생성해 내.. 극히 일부만 관리되는 한계
생성형 AI 시대, AI 학습 위한 데이터 고갈 이슈에 주목
AI 개발 위한 데이터 확보 경쟁, 미래 AI 월드의 주도권 확보 결정짓는 요인
화물운송업계, 현재 구조화된 화물운송 데이터 관리 위주.. 비정형 데이터의 중요성 인식
AX(AI 전환) 시대, 데이터 관리에 더 많은 관심과 노력 기울여야 할 때
[뉴스투데이=김승한 경기대 겸직교수, 전국화물자동차운송사업연합회 단장] 태생적으로 역동적인 물류는 매일매일 엄청난 양의 데이터를 생성해 내고 있다.
물론 일상에서 발생하는 대다수의 물류 데이터는 극히 일부만 전산화 과정을 통해 저장, 관리되는 한계가 있는 것도 사실이다.
우리나라 물류는 도로 위주의 운송으로 이루어져 있어 화물자동차 운수산업은 국가 경제를 움직이는 중추적인 역할을 한다.
화물운송사업자를 대표하는 연합회의 화물정보플랫폼을 준비하는 필자의 입장에서 미래 AI 시대에 국부 창출의 소재가 될 화물운송 ‘데이터’를 어떻게 바라봐야 할지 고민스럽지 않을 수 없다.
• 학습할 데이터를 걱정하는 AI의 현실
생성형 AI가 새로운 어려움에 직면하고 있다. 오픈AI와 MS, 구글, 그리고 메타 등 LLM(대규모 언어모델) 구축을 주도하는 빅테크들의 치열한 경쟁으로 인해 개발에 가속도가 붙으면서 자신들의 AI를 학습하기 위한 데이터 고갈 이슈를 겪고 있다고 한다.
LLM은 데이터 학습 없이는 고도화할 수 없고, LLM은 보통 매개변수가 많을수록 성능도 좋아지는데, 매개변수가 커지면 그만큼의 데이터가 더 필요하기 때문이다.
오픈AI는 음성 인식 도구를 통해 100만 시간 이상의 유튜브 동영상 데이터를 텍스트화했다고 한다. 구글은 저작권 침해를 감수하고 유튜브 영상을 활용했다고 하며, 더 많은 데이터의 공개적 활용을 위해 개인정보보호 약관을 변경하기도 했다. 메타는 AI 모델 개발을 위해 자사 소셜미디어는 물론 인터넷에 있는 거의 모든 영어책, 에세이, 시, 뉴스 기사를 불법적으로도 사용했다고 전해진다.
영국 과학 전문지 뉴사이언티스트는 언어 데이터 부족으로 2026년 정도에는 AI가 새로 학습할 데이터가 더이상 없다는 예측 결과를 내놓기도 했다.
학습할 데이터 고갈은 비단 생성형 AI만의 문제는 아니다. 로보틱스, 자율주행 모든 분야에서 인공지능 개발을 위한 데이터 확보 경쟁은 미래 AI 월드의 주도권 확보를 결정짓는 요인이 되고 있다.
• 화물운송시장 데이터의 한계
현재 화물정보망을 비롯한 화물운송업계에서 관리되고 있는 데이터의 공통점은 구조화된 화물운송 데이터라 할 수 있다.
상차지, 도착지를 포함하는 거리 등 지리적 정보, 출발/도착에 따른 예정 혹은 실제 시간 정보, 운송비용 관련 가격 정보, 운송차량/화물 정보 등 주문과 실제 운송 결과를 기록한 정형화된 데이터가 관리되고 있을 뿐이다.
이전 화물정보플랫폼 재직 시절 산학연구를 통해 AI 화물운송가격정보 프로젝트를 진행한 적이 있다. 사실 구조화된 데이터 기반으로 확인할 수 있는 것은 상관관계 수준에 근거한 관계성 수치 정도에 국한될 수밖에 없는 한계가 있었다(그나마 요일에 따른 운임가격 차이 수준을 확인한 정도가 성과였지 않나 싶다.).
최근 생성형 AI를 접하고 이해하면서 느낀 생각은 비정형 데이터의 중요성이다. 화물의 종류와 특성, 상하차지의 조건. 구간 진입난이도 등 수치화하기는 어렵지만 차주들은 경험적으로 난이도 계산에 반영하고 있는 결정적인 요인들을 인식한다는 사실이다.
2022년 일론 머스크가 트위터를 440억달러(약 60조6천억원)에 인수했을 때 많은 사람들이 의구심을 제기했었다.
하지만 돌아보면 일론 머스크도 트위터(현재 X)를 통해 자율주행, 로봇과 같은 인공지능을 학습시킬 풍부한 각종의 데이터를 얻으려 한 큰 그림이 있었을 것으로 짐작된다(물론 고가의 트위터 인수결정을 일런 머스크가 곧바로 번복하는 해프닝이 있었긴 했지만..).
• 화물시장 역동성, 인간이 가장 잘 알고 있다
우선 필자의 몇 가지 현장 경험을 공유하고자 한다.
첫째는 차주에 대한 운임지급 지연을 해결하려 화주업체를 직접 방문하기까지 했던 기억이다. 당시 체불 이슈가 이미 그 지역 차주들에게는 널리 공유되어 차주들 간 배차거부 등 담합으로 배차 비용이 많이 상승했고, 배차도 매우 어려워 제품의 공장 출하가 힘들었던 상황이다.
둘째는 반대 경우로 배차 후 2~3일 내 운임지급을 원칙으로 하는 주선사 회원이 있었는데, 이런 정보를 많은 차주들이 알게 되어, 결국은 다양한 화주를 상대로 영업한 화물을 차주들이 서로 배차받으려 했던 사례이다.
위 사례에서도 보듯이 운임가격 같은 단순 숫자만으로 화물운송이 결정되는 것은 아니고, 여러 비구조화된 정성적 정보와 이들 정보의 공유 정도가 오히려 실제 운송시장의 의사결정을 만드는 직접적인 원인이란 사실을 쉽게 알 수 있다. 즉, 인간은 역동성을 예측하는 정보를 누구보다 잘 알고 이를 반영하고 있다는 사실이다.
• 플랫폼의 목적은 ‘돈’이 되는 화물운송 데이터 만드는 것
필자가 속한 화물자동차운송사업연합회는 현재 통합 화물정보플랫폼을 준비 중에 있고, 20만 차주와 1만여 운송사 회원으로 구성된 자체 커뮤니티 내의 다양한 정보를 공유하는 채널을 구축하려 하고 있다.
작게는 화주와 연계되는 협회 내부에서 발생하는 트랜잭션 데이터의 관리에 집중하게 되겠지만, 더 나아가서 20만 차주와 1만여 운송사가 실시간으로 공유하는 각종의 정성적 데이터(음성, 이미지, 동영상 등) 및 양질의 분석 데이터, 외부 환경 데이터 등 또한 연합회 통합플랫폼의 귀중한 자산으로서 관리될 수 있는 인프라를 구축하는 데 노력하고자 한다.
DX(디지털 전환) 시대에 데이터가 이미 금맥으로 떠올랐다면, AX(AI 전환) 시대에 더 큰 가치가 입증된 데이터 관리에 더 많은 관심과 노력을 기울여야 할 때이다.
[정리=최봉 산업경제 전문기자]
댓글 (0)
- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.