-
통역 AI 사투리 높임말도 번역카카 2022. 5. 14. 15:00
구글은 규모와 기술적 측면에서 매우 훌륭합니다. "구글과 번역 언어의 수로 승리할 의도는 없습니다. 구글 번역가의 방향은 파파고와 다른 지향점을 가지고 있습니다 (구글 번역가는 109 개 언어를 다루고 있습니다). 파파고는 좀 제한된 번역기(15개 언어)이지만 구글보다 한글 기반 번역 수준이 더 뛰어나다”고 말했습니다.
한영의 경우 파파고가 100점 만점에 80점에서 90점 사이였다면 구글은 70점에서 80점 사이였습니다. 무작위로 추출한 수백 개의 한국어 문장을 파파고와 구글로 각각 번역한 뒤 한국어와 영어에 능통한 전문가들로부터 평가를 받는 방식입니다. 파파고는 우리 말의 높은 단어와 방언을 번역합니다. 한국과 일본 번역의 경우 95 점입니다. "
통과 번역의 원칙이 궁금합니다. "파파고는 기본적으로 학습을 반복함으로써 정확성을 향상시키는 인공 지능 기술입니다. 파파고를 배우려면 원본과 번역이 필요하지만, 우리는 그것을 "말의 뭉치"라고 부릅니다. 번역 엔진이 너무 많이 배우고 사용자가 요청하면 학습한 것을 기반으로 번역 결과를 제공합니다. (통역과 번역은 다른 언어를 의사 소통할 수 있도록 이동하지만 번역은 단어와 번역이 다르다는 점에서 다릅니다. 통역을 하려면 음성을 데이터로 바꾸고 데이터를 음성으로 거꾸로 바꾸는 기술을 추가해야 합니다.)
처음부터 기계 번역이 그렇게 되지는 않았습니다. "처음에는 번역에 필요한 단어와 문법 규칙을 모두 입력하여 결과를 도출하는 시스템이었습니다. 그러나 문법이 복잡하고 예외가 많기 때문에 열심히 입력하면 오류가 너무 많아서 널리 사용되지 않았습니다. 통계 기반 기계 번역 (SMT)이 다음과 같습니다. 말뭉치를 모아서 배우는 것은 지금과 같은데 학습 결과를 바탕으로 특정 단어가 번역될 확률을 먼저 구한 다음 이 통계를 바탕으로 번역하는 시스템입니다. 파파고는 초기 서비스에서이 기술을 사용했지만 한국어와 영어와 같은 언어 사이에는 오류가 있었습니다. "
“그런 단어들은 개인과 국가, 문화, 상황에 따라 달라질 수 있습니다. “아가씨”라는 단어는 우리 나라에서 통하는 뉘앙스를 의미하지는 않습니다. 번역 오류로 인한 사건이 종종 국내외에서 일어나는 것으로 알고 있습니다.”
통역사는 어느 정도 진화할 수 있습니까? "이제 통역 기술은 두 언어의 문장 쌍을 입력하고 배우는 방식입니다. 문제는 새로운 단어와 문장이 계속 발생한다는 것입니다. 이 때문에 주기적으로 학습 데이터를 입력해야 합니다. 더 많은 데이터를 배울수록 번역 정확도가 높아집니다. 컴퓨팅 파워와 통신 기술의 발전은 통역 및 번역 품질을 더욱 발전시킬 것입니다. 현재 딥 러닝 방식으로 데이터를 배우면 번역 수준이 95 점까지 올라갈 수 있습니다.하지만 100점에 도달할 수 있을지는 모르겠습니다.”