현지화
LAB 메인으로 돌아가기
게임용 기계 번역을 위한 여정
지난 수 세대에 걸쳐 툴이 지원하는 번역 기술은 상당히 진화하였습니다. 기계가 지원하는 번역에 대한 아이디어는 게임 현지화에현지화에 있어 그것이 약속하는 더 신속한 해결책과 훨씬 더 많은 양의 번역을 처리할 수 있는 능력으로 인해 일종의 성배와 같이 취급되었습니다.
하지만 인간의 언어가 연관된 모든 계획이 그러하듯, 기계 번역 프로세스를 완벽하게 만드는 것은 험난한 길이었습니다. 관용구, 지역별 속어, 그리고 사람들이 의사소통하는 방법에서 나타나는 특수성은, 기계가 이를 적절히 이해한다는 부분에 있어서 여러가지 도전 과제를 안깁니다. 목표는 명확했지만, 현재 수준의 능숙함을 달성하기까지는 수년간의 시행착오를 겪어야만 했습니다. 그리고 여전히 많은 인간의 개입을 필요로 하죠. 이번 시간에는 기계 번역(MT: Machine Translation)의 역사와 이를 도입하기 위한 PTW의 여정, 그리고 미래의 게임들에게 가져다 줄 이득과 난제가 무엇일지 알아보겠습니다.
역사적으로 사람에 의한 번역, 수정, 검수는 시간이 걸리고 모든 걸 수동으로 진행하는 프로세스입니다. 팀은 보통 번역자와 검수자의 비중을 2:1로 맞춰 구성하죠.
초기 기계 번역 사례는 대부분 정부가 기금을 지원한 것들입니다. 지난 70년 동안 기계 번역 시스템에 대한 막대한 투자가 이뤄졌으며, 여기에 최근 정확도 및 신뢰성을 개선하기 위한 딥러닝 및 인공신경망에 대한 개발이 더해졌습니다.
신경망 기계 번역 엔진은 문장을 하나하나 번역하는 것이 아니라, 사람의 뇌처럼 문장들 전체를 한 번에 번역하는 언어적 규칙을 흉내내는 인공신경망을 활용합니다. 이것은 더 정확하고, 사람처럼 들리면서, 좀 더 쉽게 읽힐 수 있는 더 고품질의 번역을 제공할 수 있게 됩니다.
기계 번역이 주는 이점은 분명합니다. 더 많은 콘텐츠를 더 빠르게 번역할 수 있습니다. 비디오 게임 콘텐츠와 같이 더 복잡하고 창조적인 번역을 위한 더 많은 시간을 확보할 수 있습니다. 또한, 인간에 의한 기존 번역 방식에 비해 더 많은 분량을 더 빠르게 수정 편집(포스트에디팅)이 가능한 전문 번역가의 생산성이 크게 향상되었습니다. 시간을 절약하는 것은 물론, 전통적인 번역/수정 워크플로우에 비해 포스트에디팅 및 샘플 리뷰 워크플로우를 통한 비용 절감도 상당합니다.
기업으로서 끊임없이 진행되는 당사의 내부 프로세스는, 우리가 언제나 업계 트랜드 및 기술 개발 부문에서 가장 앞선 기업으로 남는 것입니다. 우리는 급격하게 변화하는 기계 번역 분야에 대한 수많은 논의와 분석을 진행하였습니다. 신경망을 이용한 번역 엔진의 확산과 우리의 파트너들에게 제공할 수 있는 이점 등을 고려하여, 우리 PTW는 이를 회사의 프로세스에 이를 통합하기로 결정했습니다.
처음에는 기계 번역을 내부 소속팀들의 생산성을 향상시키기 위한 도구로서 시험해 봤습니다. 내부 커뮤니케이션이나 기업 자료, 버그 리포트 등을 일본어에서 영어로, 그리고 그 반대로도 번역해 제공했습니다.
초기에는 우리에게 주어진 시간과 노력을 하나의 특정 기계 번역 서비스 제공자에게 투자했었지만, 몇 번의 테스트를 거친 뒤엔 특정 언어쌍과 주제에 있어선 다른 기계 번역 엔진의 성능이 더 뛰어나다는 것을 알았습니다.
여러 개의 엔진을 시험해 보았는데, 각각의 엔진을 가지고 내부 개발팀과 플레이어 지원팀 간의 내부 커뮤니케이션 내용을 6개의 언어로 시험해 보았습니다.
이런 시험 데이터에 대해 정확성, 유창함, 발생된 에러 건수, 전체 세그먼트 대비 포스트 에디팅을 요구하지 않는 세그먼트의 비중, 그리고 가장 흔한 에러 항목들을 기준으로 데이터를 수집, 분석, 결론을 도출했습니다. 이러한 결과는 우리가 관심 있는 다른 언어 조합에 딱 맞는 상위 4개 엔진이 무엇인지 알려주었습니다. 또한 좀 더 쉽게 접근할 수 있고 커스터마이징이 가능한 플러그 앤 플레이 엔진에 대한 실험에도 많은 노력과 시간을 들였습니다.
하나의 솔루션에만 집중하는 것이 훨씬 쉽고 훨씬 덜 복잡했겠지만, 우리가 제공하는 어떤 언어도 번역의 품질을 타협하고 싶진 않았습니다. 그래서 요구되는 텍스트의 유형과 특정 언어 조합에 최적화된 엔진을 사용하는 맞춤형 워크플로우를 만들기로 결정했습니다.
엔진 불가지론자가 된다는 것은 우리이게 언어와 텍스트 유형에 맞는 엔진을 선택할 수 있는 자유와 유연성을 제공해 주었습니다. 이는 우리로 하여금 다른 언어와 다른 유형의 게임 프로젝트를 이전에는 불가능했던 방식으로 지원할 수 있게 되었다는 것을 의미합니다.
우리 테크놀로지 팀은 데이터 큐레이션, 엔진 트레이닝 및 배포에 대한 지원은 물론 사용하고 있는 기존 툴과 이 엔진들을 연결하고, 필요한 경우 새로운 툴을 만들어 내는 등 깊이 참여하였습니다. 또한 유럽 및 아시아 지역 언어에 대한 품질 분석 및 평가에도 상당한 시간과 자금을 투자하였습니다. 여기에는 직원 대상 교육, 엔진 트레이닝, 기계 번역에 대한 평가 및 포스트에디팅을 위한 인간이 개입에 필요한 데이터 수집 및 큐레이션을 포함하고 있습니다.
당사의 프로세스는 우리 파트너사가 운용하는 현지화 워크플로우에 맞는 기계 번역 서비스에 대한 정의 및 구현에 참가합니다.구체적으로는, 엔진 커스터마이제이션 및 품질 검증에서부터 특정 게임 및 프렌차이즈를 위해 각 언어 별로 적합한 엔진 매칭까지 포함합니다.
엔진이 선정되면 트레이닝을 거치게 되며, 연관된 CAT 툴 및 TMS에 끊김없이 연결됩니다. 이 프로세스는 번역 품질을 유지하기 위해 언제나 당사에 소속된 게임 스페셜리스트에 의한 포스트에디팅 과정으로 마무리 됩니다.
기계 번역 기술의 개발 및 신경망 기반 기계 번역이 제공하는 상당한 품질 개선 효과는 우리로 하여금 기계 번역 도구에 투자를 하도록 동기를 부여한 핵심 요소 중 하나입니다. 이런 투자는 번역 처리량의 증가와 작업 시간의 감소라는 결실을 맺었습니다. 하지만, 여전히 많은 개선점이 존재하고 있으며, 향후에도 이 솔루션을 사용해야 하는 더 많은 기회가 있을 겁니다.
현재 당사에서는 기계 번역 솔루션을 활용하여 플레이어 지원 문의를 빠르고 효과적으로 번역할 수 있는 내부 툴을 런칭하는 프로세스를 진행하고 있습니다. 이 툴은 당사의 플레이어 지원팀 소속 담당자들로 하여금 자신들의 모국어가 아닌 언어로 작성된 문의에 답을 할 수 있고, 특정 언어로 문의가 몰리는 경우에 최적의 상태로 팀을 지원할 수 있도록 할 수 있습니다.
비디오 게임 번역에 대한 시장이 넓어지는 지금, 우리는 핀란드어나 튀르키예어와 같이 흔치 않거나 합당한 번역 리소스 가 적은 언어 및 과거에 게임 현지화에는 적합하지 않았던 것으로 여겨졌던 언어들에 대해서 기계 번역을 사용할 것입니다.
마지막으로, 당사는 아시아 언어 간 번역(예. 일본어에서 중국어 간/번체, 중국어 간체에서 한국어 등)을 위해 MT 를 여기에 적용하여, 고품질의 번역 결과물을 얻을 수 있는 방법에 대해 연구하고 있습니다. 테스트는 내부 문서를 번역하는 것으로 시작하겠지만, 우리가 사용하는 툴이 개선되면 게임 콘텐츠로 초점을 옮길 것입니다.
아마도 기계 번역만으로는, 한 언어로 작성된 스크립트를 단순히 알고리즘을 통해 돌려서 완벽하게 번역된 텍스트를 결과물로 얻는 상황에는 도달하지 못할지도 모릅니다. 인간의 언어는 빠른 속도로 스스로, 그리고 꾸준히 진화하기 때문에, 그 연장 선상에서 완벽한 결과물이 나올 것이라는 것은 불가능할테지요. 하지만 기계 번역으로 얻는 이점은 현재의 수준에서도 분명하며, 그에 대한 연구는 각각의 개선점이 이전 것에 켜켜이 쌓이고, 다음으로 나갈 방향을 가리키면서 계속 진행될 것입니다.