본문 바로가기

졸업프로젝트

이화여대 통번역대학원 스마트러닝 시스템

안녕하세요, 이화여대 컴퓨터공학과 그로쓰3팀 주제 설명 드리겠습니다.

 

현재 이화여대 통번역대학원에서는 통역 과제 수행시 업로드된 원본음성을 학습자가 들으며 통역을 하고 녹음한 통역음성파일과 통역 음성을 그대로 받아쓴 전사자료를 함께 제출합니다. 과제 제출이 완료되면 교수자는 원문음성파일을 전사한 텍스트 파일과 학습자의 통역음성파일을 동시에 열어놓고 원문과 비교하며 평가합니다.

 

이화여대 통번역대학원 강사를 대상으로 하는 설문조사에 따르면 다음과 같은 문제점이 있었습니다.

1. 통역음성파일 전사하기

통역의 완성도를 높이는 데에는 언어적 부분과 비언어적 부분이 모두 중요하기 때문에 학습자들의 통역 결과를 정확하게 평가하기 위해서는 반드시 통역음성파일과 통역을 전사한 파일이 필요합니다. 이런 과정에서 교수자나 학습자는 통역음성파일 듣기와 재생하는 과정을 수차례 반복하고, 여러개의 전사 파일을 생성해야 합니다.

전사 파일을 생성하는데 일부는 구글 STT 등의 음성인식을 사용했습니다. 하지만 구글과 네이버 음성인식의 경우 반복되는 말 중 일부만을 출력하고, '어, 음'와 같은 추임새는 출력되지 않습니다. 또 문맥에 따라 일부 수정된 텍스트가 출력되는 문제가 있었습니다. 결국 이를 수정해야 하는 과정이 필요하다는 것입니다.

2. 통역 개시 지연 시간 파악

연사의 발언 후 통역이 개시되기까지의 시간을 '통역 개시 지연 시간'이라고 합니다. 순차통역에서는 연사의 발화가 끝난 후 가능한 빨리 통역이 시작되는 것이 좋으므로 원문 음성 출력 이후의 통역 개시 시점은 매우 중요한 평가 요소입니다. 이를 확인하기 위해서 학습자가 원본음성과 통역음성을 함께 녹음하거나 교수자가 원본음성과 통역음성의 길이를 직접 비교해 대략적으로 유추합니다.

하지만 두 방법 모두 정확한 통역 개시 지연 시간과 이를 직관적으로 알기 어렵습니다.

3. 객관적 평가 지표

앞서 말한 전사파일을 생성하고 통역 개시 지연 시간을 파악하더라도 교수자는 모든 학습자의 통역 전사 파일을 비교하고 평가를 해야 합니다. 또 이러한 과정에서 여러 개의 피드백 문서를 작성해야 합니다.

학습자의 경우 정확한 평가 기준을 알 수 없으며 다른 학습자와 직관적 비교가 어렵습니다. 통역음성에 대한 통계 지표가 존재한다면 교수자는 다수의 학생들을 비교, 평가할 때 용이하고 학습자도 스스로 평가할 때 잘 활용할 수 있을 것 입니다. 하지만 이 자료가 따로 제공되지 않아 직접 파악해야 하는 과정에서 많은 시간이 듭니다.

 

 

이러한 과정들은 많은 시간과 수고가 들어 실제 학습자들의 통역을 평가하는데 충분한 시간을 확보할 수 없다고 합니다.

 

저희 팀은 이화여대 통번역대학원 교수님들과의 인터뷰와 회의들로 이런 불편함이 존재함을 알게되었습니다. 그리고 이중 일부가 4차 산업시대의 기술로 충분히 대체할 수 있다고 생각했습니다. 

 

이를 해결하기 위해 전사자료 생성, 통역개시지연시간 측정, 통역의 평가지표 통계 기능이 포함된 스마트러닝 시스템을 개발하였습니다. 현재는 관련해서 특허 출원을 완료했습니다.

 

 

 


아래 팀원들의 블로그를 가면 딥러닝 모델 구현 및 정확도 개선, 서버 개발, 안드로이드 개발 과정과 기술 설명을 볼 수 있습니다.