'국내 최초 100% AI 제작', 유례없는 도전과 깨달음

이 기사를 공유합니다

[제작기] 제작비 70만원 들여 만든 EBS '이비스의 사람공부'
'디지털 십자수' 놓으며 인간의 빈자리 느껴

EBS가 AI단편극장으로 선보인 '이비스의 사람공부' 
EBS가 AI단편극장으로 선보인 '이비스의 사람공부' 

[PD저널 =민성원 EBS PD] 2025년 6월 26일 저녁 9시 51분. 영상을 완성했다. ‘AGI가 되기 위해 인간을 공부하는 AI의 성장일기’ 콘셉트. 100% AI 제작 프로그램. 배경씬은 프랑스 파리. 픽사에서 본듯 뻔하게 생긴 로봇 캐릭터가 주인공이다. 그리고 실제 사료와 똑같이 생긴 나폴레옹이 나타나 로봇을 교육한다. 그렇게 콘텐츠 하나가 완성됐다. 주변을 둘러본다. 싸늘하다. 제작 기간 15일. 그간 내 곁에는 아무런 인간도 없었다. 이제 막 전원이 꺼진 검은색 컴퓨터 한 대뿐.

국내 최초 전편 AI 제작 방송 프로그램을 자처하는 ‘EBS AI 단편극장’에서 <이비스의 사람공부>를 연출했다. 올해 초 AI 제작 특임팀으로 발령받았고, 제작비 70만 원으로 100% AI 1인 제작 방송물을 만들어내야 했다. 실로 방송가에 유례가 없던 미션이었다.

많은 이들이 AI 영상 제작을 소위 ‘딸깍 콘텐츠’라고 명명하며 손쉽게 보지만, 이는 정말이지 모르고 하는 소리다. 한참의 생성 시간 뒤 긴장된 마음으로 재생 버튼을 누르면 일그러진 AI 얼굴이 나를 놀리듯 바라보기 일쑤였고, 얼굴이 괜찮다 하면 발바닥과 손바닥이 뒤집혀 있었다.

자연스러운 AI 음성을 흐뭇하게 듣던 내 고막은 방심하는 찰나에 터지는 굉음(?)으로 공격받았고, 청순가련하게 뽑아낸 순백의 프롬프트가 ‘윤리 규정 위반’이라며 억지 퇴짜를 맞는 일도 많았다. 무엇보다, 이렇게 고생하며 한 땀 한 땀 뽑아낸 수백 개의 AI 클립들을, 평소보다 더욱 정교하게 ‘디지털 십자수’를 떠야 그럴듯한 방송물 한 편이 나왔다.

필자는 ‘100% AI 제작’의 개념 정의가 3단계에 걸쳐 변화할 것으로 전망한다.

2025년 7월 기준 방송계의 AI 활용 단계는 굳이 따지자면 ‘0단계’인데, 100% 전편 AI 제작을 하기보다는 적재적소에 일부 활용하는 경우가 많기 때문이다. 이는 방송계가 한발 늦는 것이라기보다는, 기술의 발전 속도에 맞춰 적당한 선에서 활용을 하고 있다는 평가가 적절하다. 필자는 다소 무리하게 100% AI, 그러니까 대본 작성·배우·소품·촬영· 조명·내레이션·음악 등 편집을 제외한 모든 요소를 전부 AI로 대체하는 ‘1단계 [노가다기]‘를 억지로 시도했다. 고생해본 결과 익히 알려진 AI 제작의 효익은 자명했으나, 보다 깊은 깨달음은 인간의 무언가가 그리워지는 지점들에서 나왔다.

AI가 빛나는 순간들(2025년 7월 기준)

AI 제작이 환호받는 이유는 파격적인 ‘제작비 절감’과 ‘시간 절약’ 때문이다. <이비스의 사람공부>의 로케이션은 프랑스 파리이고, 나폴레옹과 로봇(이비스)이 등장한다. 기존 공정으로 했다면 유럽 출장, 로케이션 대여에 로봇 애니메이팅, 배우 및 스태프 비용까지 수천만 원이 들어갔을 것이다. 하지만 100% AI로 작업한 덕에, 이 거대한 작업을 단돈 70만 원에 해낼 수 있었다. 해외 출장 등으로 하염없이 늘어질 일이 없기에, 제작 기간 역시 15일 정도만 걸렸다. 후반 스태프 없이 오직 전량 1인 제작임을 고려한다면 이만한 속도의 혁신은 없다. (경기도민에게 GTX가 생겼다면 방송인에게는 AI가 생겼다!)

인간이 그리워지는 순간들(2025년 7월 기준)

100% AI를 고수하다 보니, 정작 AI의 도구성이 흐려지고 인간의 의미가 다시 반사되는 역설적인 순간들이 있었다. 가장 부족한 영역이 바로 ‘대본 구성 능력’ 즉, ‘글’이다. AI의 창작 대본은 정서적 완급조절 없이, 깊이감 없는 정보의 나열만 반복된다. <이비스의 사람공부>를 봐도 그저 연대기를 나열한 듯 매우 단조로운 느낌이 든다. 이는 내가 메인 작가 역할을 맡긴, 최상위 AI 모델의 대본 구성 능력이, 시청자의 몰입을 창조하는 최상위 방송 작가의 그것을 아직 따라가지 못하기 때문이다. 

‘오디오 능력’도 부족하다. 보통 제작진은 대사에 담겼으면 하는 정서나 분위기를 배우에게 직접 전달한다. 배우는 이를 인간적으로 해석하고 아름다운 결과물을 산출해낸다. 하지만 AI 성우와는 그러한 섬세한 협의가 불가능했고, 어색한 AI 오디오 하나가 콘텐츠 전체 품질을 떨어뜨리는 경우가 많았다.

 ‘고증 영역’, ‘사회적 민감성 영역’ 역시 인간이 필요하다. 보통은 파이프라인 내 수십 명의 스태프들의 직·간접적 피드백을 모아, 개인이 잡아내지 못하는 민감한 요소들을 집단적 숙의로 잡아낸다. 하지만 100% AI 제작을 표방하느라 인간 스태프가 없어 검열도 오직 AI만으로 해야 한다면, 제작자는 의도치 않은 실수나 오류를 놓칠 수도 있다는 불안감을 떨쳐낼 수 없을 것이다.

헤겔의 말처럼, 존재는 부정을 통해 그 본질을 드러내기 마련이다. 우리는 무언가의 부재를 통해서야 비로소 그 존재를 의식한다. 100% AI 제작을 통해 인간이 빠져나간 그 자리를 바라보며, 오히려 인간의 정서적 떨림과 예민함이 얼마나 창의의 원천이었는지를 되짚게 되었다. 물론, 필자가 굳이 '2025년 7월 기준'이란 표식을 계속 달았듯이, 근미래에는 정서적 타격감을 충족하는 AI 대본과 AI 성우의 활약이 너무나도 당연하게 두드러질 것이다. 더 나아가, 핑거 스냅만으로도 영상이 출력되는 2단계 [핑거 스냅기]까지 분명히 도래하리라 믿어 의심치 않는다. 그만큼 급변하는 AI 세상이기에 사실 이 글의 유통기한은 한없이 짧다. 적어도 인간이 활약하는 2단계 [핑거 스냅기]까지, 이러한 기술 시황 글은 업데이트 식으로 정기 연재되어야 할지도 모른다. (3단계 [자율 창작기]에는 어차피 인간이 없을 테니!)

<이비스의 사람공부> 제작을 마친 후, 나는 다시금 인간의 정서를 헤집을 줄 아는 한 작가를 찾아갔다. 감동을 주는 목소리의 배우에게 전화를 걸었다. AI가 어찌 되든 간에 나는 당분간, 부재로 인해 반사된 그들의 소중함을 감각하려 한다. 물론 뒤에서는, 탁! 소리가 찰진 ‘핑거 스냅’을 누구보다 빠르게 연습하면서!

저작권자 © PD저널 무단전재 및 재배포 금지
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전