[미네르바의 눈] ‘챗GPT, 스테이블 디퓨전’을 보면서, ‘특이점’ 이미 와 버린 것은 아닌지

최봉 산업경제 전문기자 입력 : 2023.03.02 00:30 ㅣ 수정 : 2023.03.02 00:30

[기사요약]
딥러닝 붐 이후 10년째, AI는 획기적인 발전속도 보여주고 있어..
현존 최고의 기술 트랜스포머, 챗GTP로 날개를 달다
GAN을 추월한 스테이블 디퓨전, 화가들의 일자리를 위협하다
예상 뛰어넘는 AI 기술 발전, 이미 특이점에 와 있는 것은 아닌지?

  • 카카오스토리
  • 네이버밴드
  • 페이스북
  • 트위터
  • 글자크게
  • 글자작게
image
[출처=YouTube]

 

[뉴스투데이=주재욱 서울연구원 연구위원] AI의 세 번째 붐이 시작된 이래 딥러닝의 미래에 대한 전망이 쏟아져 나왔다.

 

알렉스넷이 세계 최대 이미지 인식 대회인 ILSVRC((Imagenet Large Scale Visual Recognition Challenge)에서 우승한 지 10년이 지난 지금 업계의 공통된 반응은 “AI 기술 발전은 우리의 예상을 뛰어넘고 있다”는 것이다.

 

AI는 이미지와 텍스트 두 가지 분야가 약간은 다른 경로로 발전하면서 때로는 서로 혁신적인 기술을 주고받기도 했는데 최근에 우리를 놀라게 한 것이 두 가지가 있다.

 

텍스트 분야에서 오픈AI가 만든 챗GPT와 이미지 분야에서 스테빌러티AI(Stability.ai) 등 기업들이 주도하는 스테이블 디퓨전(Stable Diffusion)이 그것이다.

 

image
[출처=medium]

 


• RNN과 어텐션을 계승한 트랜스포머, 현존 최고의 AI 기술

 

최초의 성공적인 딥러닝 모델 이후 또 많은 새로운 모델이 개발되었지만 현재 최고의 기술로 각광받고 있는 모델은 트랜스포머(transformer)다.

 

평면상에서 이미지 데이터의 좌표 특성을 반영해 딥러닝 초기에 이미지 인식에서 좋은 성과를 보였던 CNN(Convolution Neural Network)보다 조금 늦게 정보의 앞뒤 순서가 중요한 의미를 갖는 텍스트 분석에 유용한 재귀적 신경망 RNN(Recurrent Neural Network)이 개발되었다.

 

2014년 드미트리 바흐다나우(Dzmitry Bahdanau)가 중요한 정보에 집중하는 레이어를 포함시켜 RNN의 속도를 향상시킨 것이 어텐션 매커니즘(Attention Mechanism)이고, 여기서 어텐션 레이어만을 남기고 나머지 레이어를 생략해 성능 향상을 이룬 것이 2017년 구글의 아시시 바스와니(Ashish Vaswani)와 연구팀이 만든 트랜스포머이다.

 

언어를 가리지 않고 너무나 사람 같은 문장을 생성해내 최근에 세상을 떠들썩하게 만들고 있는 오픈AI의 챗GPT도 트랜스포머 기술을 기반으로 한다.

 

image
[출처=ukdaily news]

 


• 일러스트레이터의 일자리를 위협하는 스테이블 디퓨전

 

이미지 분야에서는 인식과 분류에 집중하던 초기의 모형에 이어 생성 모형(generative model)이 개발돼 AI가 그림을 만들어 내기 시작했다.

 

이 중 2014년 이안 굿펠로우(Ian Goodfellow)가 개발한 GAN(Generative Adversarial Network, 생성적 적대 신경망)은 진짜 같은 그림을 만드는 생성자(generator)와 그림이 진짜인지 판별하는 판별자(discriminator)를 동시에 학습시킨 뒤 서로 경쟁하게 만들어 성능을 향상시킨다는 획기적인 아이디어를 적용해, 이미지 생성에서 엄청난 발전을 이루었다.

 

GAN의 뒤를 이어 현재 이미지 생성 분야에서의 최첨단은 스테이블 디퓨전 모형이 차지하고 있다.

 

AI 기업인 스테빌러티AI가 만든 스테이블 디퓨전은 2015년 야샤 솔-딕스타인(Jascha Sohl-Dickstein)의 아이디어에서 비롯된 확산 모형(diffusion model)을 기반으로 한다.

 

통계적 확률과정인 마코프 체인을 활용, 이미지 픽셀이 점차 흩어져 노이즈로 변하는 과정의 역변환을 파라미터화하여 노이즈로부터 이미지를 만드는 과정을 학습하는 원리로 작동한다.

 

이후 오픈AI의 달리(DALL-E) 2, 미드저니(Midjourney) 등이 발전시켜 간단한 텍스트만으로 환상적인 그림을 만들어 내고 있다.

 

스테이블 디퓨전이 생성하는 이미지들은 실제 현장에서 상업적 일러스트레이터의 일자리를 위협할만한 수준으로 발전했다.

 

image
[출처=insidetelecom]

 


• 인간을 대신할 수 있는 AI, 이미 특이점이 우리에게 와 있는가?

 

이미지 생성이나 텍스트 생성에서 괄목할 만한 성과를 보여준 최근의 AI는 인간과 구별이 안 될 정도의 복잡한 과정을 포함하는 창조 활동이 가능함을 보여주었다.

 

이러한 성능의 AI는 수학, 물리학, 화학, 생물학 등 과학 연구에도 깊이 관여하거나 프로그래밍 언어 코딩을 하는 등 그 활용 범위와 수준이 우리의 예상을 아득히 뛰어넘고 있다.

 

레이 커즈와일이 과거에 언급한 바 있는 특이점(singularity point, 획기적이고 돌이킬 수 없는 변화)이 이미 와 버린 것은 아닌지 두렵기까지 하다.

(※특이점 관련 정보는 “[미네르바의 눈] 특이점(Singularity)은 정말 가까이 와 있는가? (上, 中, 下)”, 2022.5 내용 참고)

 

[정리=최봉 산업경제 전문기자]

 

 

 


image

댓글 (0)

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.

- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

0 /250