여러분, 혹시 해외 직구 하거나 원서 읽을 때 번역기 돌려보고 "응? 이게 뭔 소리야?" 했던 적 있으시죠? 저도 가끔 번역기가 창조 경제급 오역을 내뱉을 때면 참 난감하더라고요. 그런데 오늘, 2026년 1월 23일! 구글이 번역계의 판도를 바꿀 엄청난 녀석을 세상에 내놓았습니다. 이름하여 '트랜스레이트젬마(TranslateGemma)'! 이게 왜 대박이냐고요? 지금부터 에디터와 함께 쉽고 재미있게 파헤쳐 봅시다!
- 구글이 55개 언어를 지원하는 오픈 소스 번역 모델 '트랜스레이트젬마'를 출시했어요.
- 덩치는 작아졌는데 성능은 거대 모델(LLM)급! 모바일에서도 쌩쌩 돌아갑니다.
- 텍스트는 기본, 이미지 속 글자까지 번역하는 멀티모달 능력까지 갖췄답니다.
덩치는 다이어트, 지능은 수능 만점?
이번에 공개된 트랜스레이트젬마는 '젬마 3(Gemma 3)'를 기반으로 만들어졌어요. 특징은 4B, 12B, 27B 세 가지 사이즈로 나왔다는 건데요. 여기서 'B'는 매개변수(Parameter)를 뜻해요. 쉽게 말해 뇌세포 개수라고 생각하면 됩니다. 놀라운 건 12B 모델이 자기보다 두 배나 큰 27B 모델의 번역 실력을 압도했다는 거예요! 작은 고추가 맵다더니, 구글이 '지식 증류(Distillation)' 기술로 알짜배기 정보만 쏙쏙 압축했기 때문이죠.
어떻게 이렇게 똑똑해졌을까? (비밀은 2단계 학습)
구글은 이 모델을 가르칠 때 아주 혹독한(?) 과정을 거쳤다고 해요. 먼저 사람이 직접 번역한 데이터와 구글의 최강 AI '제미나이'가 만든 데이터를 섞어서 기초를 다졌고요(SFT 단계). 그 다음에는 강화 학습(RL)을 통해 문맥이 자연스러운지, 오역은 없는지 끊임없이 검토받았답니다. 특히 한국어를 포함한 55개 언어를 집중 공략해서 우리에겐 더 반가운 소식이죠!
이미지 번역도 문제 없어요!
이 모델, 텍스트만 잘하는 게 아닙니다. 이미지 속의 텍스트를 읽고 번역하는 능력도 수준급이에요. 별도의 멀티모달 학습 없이도 기본 텍스트 번역 능력이 워낙 좋다 보니 이미지 번역까지 덩달아 잘하게 된 '천재적인 케이스'라고 할 수 있죠. 이제 해외 맛집 메뉴판 찍어서 바로 번역할 때 오역 때문에 엉뚱한 음식 시킬 일은 줄어들겠네요!
자주 묻는 질문 (FAQ)
구글의 이번 발표는 단순히 새로운 번역기를 내놓은 게 아니라, '누구나 어디서든 고품질 번역을 쓸 수 있는 시대'를 열었다는 데 큰 의미가 있어요. 저도 개인적으로 로컬 환경에서 돌아가는 12B 모델을 테스트해 볼 생각에 벌써 가슴이 웅장해지네요! 여러분의 생각은 어떠신가요? 댓글로 자유롭게 나눠주세요!
[이 글은 최신 IT 기술 정보 제공을 목적으로 작성되었으며, 기술적 세부 사항은 개발 환경에 따라 차이가 있을 수 있음을 알려드립니다.]