AI라는 건축가가 집을 짓는 법
상상해 보세요. 눈 깜짝할 새 고층 빌딩을 짓는 건축가가 있습니다. 비결은 벽돌을 하나씩 쌓는 게 아니라, '거실'이나 '주방'이 완성된 거대한 판넬을 통째로 조립하는 거예요. 이게 바로 최신 인공지능이 글을 읽는 방식입니다. 글자 하나하나를 읽는 게 아니라, '토큰'이라 불리는 단어 덩어리를 덥석 집어서 처리하거든요.
그런데 설계자가 "저 판넬에서 왼쪽 세 번째 벽돌만 빼주세요"라고 하면 건축가는 당황합니다. 이미 단단하게 포장된 판넬이라, 그 안에 들어 있는 개별 벽돌은 볼 수도 만질 수도 없거든요. AI도 똑같습니다. 단어의 뜻은 완벽하게 알지만, 그 단어를 이루는 철자 하나하나는 보지 못하는 맹점이 있죠.
현장 소장이 시험을 냅니다. "이 판넬에 벽돌이 정확히 몇 개지?" 건축가는 세는 대신 판넬 크기를 보고 대충 숫자를 찍어서 틀립니다. 반면 "방 배치를 바꿔라"는 주문은 기가 막히게 해냅니다. 벽돌을 세는 건 불가능해도, 수만 개의 도면 패턴을 통째로 외우고 있어서 덩어리들을 이리저리 옮기는 건 식은 죽 먹기니까요.
나라마다 건축 자재도 다릅니다. 한자를 쓰는 현장은 판넬 하나가 글자 하나의 뜻과 딱 맞아떨어져서 실수가 적어요. 반면 한국어 현장은 좀 다릅니다. 자음과 모음이 복잡하게 조립된 구조인데, 이걸 뭉뚱그려 하나의 큰 판넬로 취급해 버리죠. 겉만 보고 속을 못 보니, 한글의 내부 구조를 다뤄야 할 때 엉뚱한 실수가 터지곤 합니다.
결국 엄청난 속도는 정밀함을 희생한 대가였던 겁니다. 이 문제를 고치려면 더 힘센 크레인이 필요한 게 아닙니다. 판넬 속을 꿰뚫어 보는 엑스레이나, 다시 작은 벽돌을 집을 수 있는 섬세한 손길이 필요하죠. 단순히 의미 덩어리를 옮기는 것을 넘어, 구조를 지탱하는 디테일까지 볼 수 있어야 하니까요.