[생성형 AI(Generative AI), 인간의 창작 영역을 넘본다! (62)] 앤트로픽의 클로드, ChatGPT-4o보다 얼마나 앞선거야? (下)

https://m.news2day.co.kr/article/20240715500210

생성형 AI(Generative AI), 인간의 창작 영역을 넘본다! (62)

앤트로픽의 클로드, ChatGPT-4o보다 얼마나 앞선거야? (下)

최봉 산업경제 전문기자

입력 : 2024.07.16 00:30

[기사요약]
‘클로드 3.5 소네트’, 대부분의 작업에서 GPT-4o 능가한다고 주장하는 몇 가지 주요 기능 포함
향상된 시각적 추론 능력, 5가지 시각 관련 작업 중 4가지에서 가장 좋은 성능 보여..
아티팩트 기능 - 소네트의 가장 눈에 띄는 기능 중 하나, 사용자가 챗봇과 상호 작용할 수 있는 방법 확장
GPT-4o와 클로드 3.5 소네트 중 누가 승자인지 단정하기 쉽지 않아..
최선의 선택, 사용자의 특정 요구 사항에 따라 달라질 것

기사공유하기: 페이스북; 트위터; 카카오스토리; 네이버밴드; URL 복사

사람들은 시, 소설, 보고서 등 글쓰기, 그림 그리기, 알고리즘 코딩 등 창작의 세계가 그동안 인간에게만 허락된 별도의 영역이라 알고 있었다. 그런데 AI(인공지능)의 발전과 함께 이제는 진화한 AI가 스스로 창작의 영역을 넘보는 시대가 되었다. 생성형 AI(Generative AI)의 등장은 인간에게 어떤 의미가 있으며 우리의 미래에 어떤 영향을 미칠지 가늠하기 쉽지 않지만, 생성형 AI는 이미 여러 분야에서 현실로 나타나 적용되고 있다. 우리에게 성큼 다가온 생성형 AI의 시장현황, 다양한 이슈와 관심 사항 등을 살펴보기로 하자. <편집자 주>

[뉴스투데이=최봉 산업경제 전문기자] 앤트로픽이 지난 6월말 출시한 AI 모델인 ‘클로드 3.5 소네트(Claude 3.5 Sonnet)’에는 대부분의 작업에서 OpenAI의 GPT-4o를 능가한다고 주장하는 몇 가지 주요 기능 또는 참신함이 포함되어 있다.

• 클로드 3.5 소네트, 시각적 추론 능력 뛰어나..

우선 시각 관련 작업에서 향상되었다는 평가를 받는다. 소네트는 5가지 시각 관련 작업 중 4가지에서 가장 좋은 성능을 보여주었다.

< 시각 관련 벤치마크 비교 >

향상된 시각적 추론 능력을 살펴보기 위해 아래 두 개의 이미지를 각각 클로드 소네트 모델에 업로드해 보았다.

좌측 이미지는 필자가 2018년 수행했던 서울시 공공빅데이터 관련 프로젝트에서 작성했던 그림이다. 이 이미지에 대해 “이 자료에서 무엇을 알 수 있습니까?”라는 질문을 했다. 소네트는 신속하게 응답해주었다.

“이 이미지는 2012년부터 2018년 8월까지 서울 오픈데이터 광장의 공공데이터 공개 건수의 증가를 보여줍니다. 이 데이터에서 제가 얻을 수 있는 주요 통찰력은 다음과 같습니다."(중략)

우측 이미지는 필자가 여권 갱신을 하면서 찍었던 사진으로, 프로필 사진으로 활용하고 있다. 역시 클로드 소네트에게 “이 사진을 보고 어떤 인상을 받았습니까?라고 물었다.” 다음은 소네트의 응답이다.

“공개된 이미지에는 진지하고 차분한 표정을 지닌 프로페셔널한 외모의 동아시아 남성이 담겨 있습니다. 그는 짧은 회색 머리를 단정하게 스타일링한 중년으로 보입니다. 그는 검은색 테 안경, 검은 양복 재킷, 줄무늬 셔츠를 입고 있습니다.(중략) 그의 옷차림과 몸단장을 보면 그가 전문직이나 임원직에 있을 수 있음을 알 수 있습니다. 중립적인 배경과 공식적인 포즈는 기업 프로필이나 공식 문서에 사용되는 얼굴 사진의 전형적인 모습입니다.

이미지에서 내가 관찰한 것을 설명할 수는 있지만 사진에서 특정 개인을 식별할 수는 없다는 점을 분명히 하고 싶습니다. 이 사람이 누구인지, 어떤 역할을 맡고 있는지에 대한 추가 정보를 공유하고 싶으시면 해당 정보에 대해 자세히 논의해 드리겠습니다.”

소네트의 시각적 추론 능력은 놀랍다. 서울시 공공데이터 공개 관련 성장과정과 증가 추세 등을 정확하게 분석했으며 의미도 부여해 주었다. 필자 여권사진에 대해서도 소네트는 냉철한 의견을 제시했다(다행히 부정적 평가를 하지 않았음).

• 아티팩트 기능 돋보여.. 대화형 AI에서 협업 작업 환경으로 진화

소네트의 가장 눈에 띄는 기능 중 하나는 사용자가 이 챗봇과 상호 작용할 수 있는 방법을 확장하는 아티팩트(Artifacts) 기능일 것이다.

아티팩트는 코드 생성 및 애니메이션과 같은 작업을 위한 새로운 UI(User Interface)이다. 이전에는 볼 수 없었던 이 기능은 대화와 함께 전용 창을 제공한다.

사용자는 코드 조각, 텍스트 문서 또는 웹 디자인과 같은 콘텐츠를 생성하는 동안 출력 미리보기를 볼 수 있다. 앤트로픽에 따르면 이 새로운 기능은 클로드가 대화형 AI에서 협업 작업 환경으로의 진화를 의미한다.

코드 생성에서는 일반적인 작업의 경우 소네트와 GPT-4o 모두 버그 없이 만들어 낸다는 평가를 받았다.

UI를 사용한 코드 생성의 경우, 소네트는 UI가 완전히 강력하지는 않았지만 기능적이었던 코드를 생성한 반면 GPT-4o는 유사한 UI를 생성하지 않았다. 여전히 대화형 명령 프롬프트를 사용하여 코드를 생성했다는 의미이다.

한 엑스(옛 트위터) 사용자는 자바스크립트 라이브러리를 활용하여 소네트의 놀라운 코드 생성 능력을 보여주었다. 그는 두 라이브러리를 결합하여 행성, 달 및 기타 천체가 시각적으로 표현되고 물리 법칙에 따라 상호 작용하는 것을 볼 수 있는 태양계의 3D 모델을 만들었다.

• 누가 승자인가? 어느 쪽이 더 낫다고 단정하기 쉽지 않아..

수학 추론 분야에서는 GPT-4o가 클로드 3.5 소네트보다 앞선다는 평가를 받는다. 그리고 최신 뉴스 접근에서도 GPT-4o가 클로드 3.5 소네트보다 유리하다.

소네트에게 “어제 서울에서 무슨 일이 일어났었나요?”라고 물어보면 “죄송합니다. 저는 어제 서울에서 발생한 특정 사건에 대한 실시간 뉴스나 정보에 접근할 수 없습니다. 내 지식 마감일은 2024년 4월이고 그 날짜 이후의 사건에 대한 정보는 없습니다.”라는 메모만 받게 된다.

하지만 GPT-4o는 훈련 데이터보다 최신 뉴스를 웹에서 검색할 수 있다는 점에서 최근 사건에 대한 정보를 제공하는 장점이 있다.

그렇다면 GPT-4o와 클로드 3.5 소네트 중 누가 승자인가? 여러 정황을 살펴보았을 때 어느 쪽이 더 낫다고 단정하기는 쉽지 않아 보인다.

궁극적으로 최선의 선택은 사용자의 특정 요구 사항에 따라 달라질 것이다.

사실적 정확성, 시각추론, 긴 문서 처리를 우선시하고 예산이 부족하다면 클로드가 더 적합할 수 있다. 반면에 더 광범위한 창의적 기능이 필요하고 추가 기능에 대해 기꺼이 비용을 지불할 의향이 있다면 ChatGPT가 여전히 더 나은 선택이다.

[email protected]

이 기자의 다른 기사 보기

앤트로픽의 클로드, ChatGPT-4o보다 얼마나 앞선거야? (下)

[관련기사] [생성형 AI(Generative AI), 인간의 창작 영역을 넘본다! (62)] 앤트로픽의 클로드, ChatGPT-4o보다 얼마나 앞선거야? (下)

많이 본 기사