쌍안경의 초점을 다시 맞추니, 암세포가 보이기 시작했어요
탐조가가 언덕에 앉아 수천 마리 찌르레기 무리를 살피고 있어요. 매는 멀리서도 금방 찾지만, 거의 똑같이 생긴 작은 새 두 종을 구별하려면 다른 기술이 필요해요. 멀리 보는 넓은 시야와, 깃털 무늬를 잡아내는 정밀한 근접 초점, 이 둘이 함께 맞아야 해요. 간암 세포를 현미경으로 등급 매기는 일이 딱 이래요. 세포들은 얼핏 다 비슷한데, 진짜 차이는 아주 미세한 무늬 속에 숨어 있거든요.
오랫동안 병리 전문의가 슬라이드를 하나하나 눈으로 분류해 왔어요. 같은 슬라이드를 두 사람이 보면 등급이 다를 때도 있고, 느리고 지치는 작업이에요. 컴퓨터 이미지 인식이 등장했지만, 보통은 고양이나 자동차 사진으로 훈련된 시스템 끝에 라벨만 바꿔 붙이는 식이었어요. 쌍안경으로 비유하면, 풍경용으로 만든 쌍안경에서 접안렌즈 뚜껑만 바꾼 셈이에요. 넓은 윤곽은 보이는데, 깃털의 섬세한 결은 여전히 흐릿하죠.
새로운 접근은 뚜껑만 바꾸는 게 아니라, 피사체에 가장 가까운 앞쪽 렌즈 그룹까지 열어서 다시 초점을 맞추는 거예요. 큰 윤곽을 잡는 깊은 렌즈는 그대로 두되, 미세한 질감과 색 차이를 잡는 앞쪽 렌즈를 암세포에 맞게 재조정하는 거죠. 거기에 끝단의 단순한 라벨 하나 대신, 여러 단계 필터를 거쳐 점진적으로 등급을 좁혀가는 긴 분류 과정을 붙였어요. 앞렌즈 재초점과 단계별 분류, 이 두 가지가 핵심이에요.
이 방식을 서로 다른 여덟 가지 이미지 인식 구조에 적용하고, 세 종류 슬라이드 모음으로 확인했어요. 공개된 간암 슬라이드, 인도 병원의 간암 슬라이드, 그리고 대장암 슬라이드였는데, 업그레이드된 시스템이 매번 기존 방식을 앞질렀어요. 공개 간암 세트에서 가장 좋은 결과는 세 조직 유형을 반복 시험에서 단 한 건도 틀리지 않고 맞혔고, 인도 병원 세트에서는 정확도가 약 97%까지 올랐어요.
더 놀라운 건 데이터 양이에요. 이전에 다른 팀은 약 3만 9천 장 이미지 조각을 써서 같은 공개 간암 세트에서 90% 정도 정확도를 냈어요. 이번 방식은 약 3천 5백 장만으로 100%를 찍었어요. 데이터는 열 배 적은데 결과는 더 좋은 거죠. 쌍안경 비유 그대로예요. 더 큰 무리를 억지로 훑는 것보다, 앞렌즈를 정확히 맞추고 분류 과정을 똑똑하게 만드는 게 나았어요.
재밌는 건, 모든 슬라이드 모음에서 같은 구조가 1등을 한 건 아니었어요. 공개 간암에서 최고였던 구조와 인도 병원에서 최고였던 구조가 달랐고, 대장암은 또 다른 구조가 이겼어요. 새 무리마다 맞는 렌즈 프로파일이 다른 셈이죠. 그런데 앞렌즈 재초점과 단계별 분류라는 업그레이드 전략 자체는 어떤 구조, 어떤 슬라이드 모음에서든 효과가 있었어요. 이 일관성이 단일 만점보다 더 의미 있어요.
이런 시스템은 아직 크고 강력한 컴퓨터가 필요해서, 내일 당장 작은 시골 병원에서 쓰긴 어려워요. 크기를 줄이는 게 다음 과제죠. 그래도 같은 암 슬라이드를 보고 전문의 둘이 의견이 갈리는 세상에서, 반복해도 거의 같은 답을 내는 도구가 생긴 건 큰 변화예요. 탐조가는 자기 눈을 버리지 않았어요. 쌍안경 초점을 제대로 맞췄을 뿐인데, 그동안 흐릿하던 깃털 무늬가 선명하게 드러난 거예요.