배우를 늘릴까, 연습을 늘릴까

작은 극장 작업실에 톱밥 냄새가 남아 있었어요. 순회공연팀이 트럭 한 대에 납작한 무대 세트를 쌓고 있었죠. 감독님은 고민했어요. 배우를 왕창 뽑을지, 적은 인원으로 가고 대신 밤마다 대본을 더 파고들지요.

보통은 배우가 많으면 더 잘할 거라 생각하잖아요. 말 외울 사람이 늘어나니까요. 말하는 인공지능도 비슷해요. 안에 ‘조절하는 부분’이 많을수록 무조건 좋을 거란 믿음이 있어요. 근데 배우가 많으면 이동도 느리고 돈도 더 들어요. 한 번 말할 때마다 비용이 커지는 셈이죠. 배우 수는 조절하는 부분 수, 대본 읽기는 연습 때 읽는 글 양, 이동비는 답변 비용이에요. 그래서 덩치보다 연습이 이길 때가 있어요.

팀은 작은 배우진을 택하고, 연습 시간을 크게 늘렸어요. 같은 생각으로 LLaMA라는 말하는 인공지능도 크기가 다른 여러 버전을 만들고, 작은 쪽에 특히 ‘읽는 연습’을 오래 시켰어요. 공개된 글만 모아서요. 손질한 웹글이 많고, 여러 언어의 백과글, 책, 코드, 질문답변 글, 과학 글도 섞였대요. 재밌는 건, 가장 작은 쪽도 오래 연습하면 어느 순간 딱 멈추지 않고 계속 나아졌다는 점이에요.

연습만 늘리면 작업실이 엉망이 되기 쉬워요. 그래서 팀은 바닥 표시를 또렷하게 하고, 같은 순서로 리허설을 돌리고, 숨을 덜 낭비하는 대사 흐름을 잡았어요. LLaMA도 비슷하게, 긴 글을 읽다가 길을 잃지 않게 하고 흔들리지 않게 만드는 장치를 넣었어요. 연습이 빨리 돌게 하려고, 비싼 일을 자꾸 반복하지 않고 꼭 필요한 메모만 남기고, 여러 기계가 신호를 잘 주고받게도 했고요.

첫 공연 날, 적은 배우가 보통은 큰 극단이 해야 할 장면을 꽤 잘 살려냈어요. LLaMA도 그런 보고가 있어요. 중간 크기 버전이 예전의 훨씬 큰 버전보다 여러 평가에서 더 나았고, 가장 큰 버전은 더 많은 비공개 자료를 쓴 최고급 시스템들과도 비슷하게 갔다고요. 상식 질문이나, 찾아보지 않고 아는 걸 말하는 데 강했고, 글 읽기 과제도 버텼대요. 수학이나 코드는 여러 답을 써 보고 가장 말이 되는 걸 고르는 방식이면 더 좋아졌고요. 다만 책 느낌의 지식 문제는 책을 더 많이 읽은 쪽이 유리했어요.

박수 받고 나서 팀은 찜찜한 부분도 봤어요. 배우가 많아질수록 말이 거칠게 튀어나오기도 하고, 원치 않는 고정관념이 대사에 섞이기도 했거든요. LLaMA도 크기가 커질수록 독한 말이 늘어나는 경우가 있었고, 종교나 성 역할 같은 쪽에서 치우침이 보였어요. 그럴듯하게 틀린 말을 자신 있게 하는 버릇도 남아 있었고요. 그래도 한 가지는 분명했어요. 덩치를 키우기만 하지 않아도, 공개된 글로 오래 연습시키면 작은 쪽도 강해질 수 있다는 길이 열린 거예요. 대신 안전과 정직함은 저절로 따라오지 않아서, 따로 손봐야 했고요.