KT, 인간 감정 더빙하는 AI 음성합성 서비스 출시
[뉴스투데이=이화연 기자] KT는 인간의 감정을 담은 음성합성 콘텐츠를 제작할 수 있는 ‘인공지능(AI) 보이스 스튜디오’ 서비스를 출시했다고 19일 밝혔다.
AI 보이스 스튜디오는 AI 목소리 100개를 활용해 즐거움, 침착함, 중립, 슬픔, 화남 등 5가지 감정을 표현하는 ‘AI 보이스’, 오디오 합성 콘텐츠를 제작할 수 있는 ‘스튜디오’로 구성됐다.
특히 AI 보이스 스튜디오는 국내 최초로 ‘감정 더빙’ 기술을 탑재했다. 감정 더빙 기능을 활용하면 AI 보이스를 고객이 낭독한 감정 그대로 더빙할 수 있어 더 생생한 AI 음성을 만들 수 있다.
또한 AI 보이스 스튜디오가 제공하는 AI 목소리는 한국어, 영어, 중국어, 일본어 4개국어로 ‘다국어 합성’이 가능해 글로벌 시장을 노리는 제작자들에게도 유용하다고 KT는 설명했다.
KT는 매력적인 AI 목소리를 제공하기 위해 유명인들의 음성을 AI로 제공하는 ‘셀럽 AI 보이스’를 준비했다.
첫번째 셀럽 AI 보이스는 가수 윤도현이다. 서비스 이용 고객은 윤도현의 낭독체와 대화체로 오디오북을 제작할 수 있다. 문맥에 따라 강약을 줄 수 있도록 행복, 슬픔, 분노 등의 감정 표현도 제공한다.
KT는 AI 보이스 스튜디오의 우수함을 알리기 위해 KT 계열 독서 플랫폼 ‘밀리의서재’와 협업해 윤도현 셀럽 AI 보이스를 활용해 인기 도서 ‘인간관계가 힘들어서 퇴사했습니다’의 오디오북을 제작했다.
최준기 KT AI·빅데이터사업본부 본부장은 “이번 AI 보이스 스튜디오는 KT만의 차별화된 AI 기술로 인간에 가까운 감정을 표현하는 등 AI 목소리의 가치를 향상시켰다”며 “향후 KT는 그룹사를 비롯한 다양한 파트너와 협력해 더 혁신적인 AI 보이스 스튜디오 서비스를 지속 출시하겠다”고 말했다.