본문 바로가기

파이썬

Kaldi를 사용하여 decoding 결과 분석하기

Prerequisites: ref, hyp 파일

'index \t 문장'의 형태로 구성된 ref 파일
'index \t 문장' 의 형태로 구성된 hyp 파일

cd /kaldi/egs/wsj/s5 ## 해당 폴더 내에 존재하는 kaldi에서 제공하는 toolkit 사용

vi path.sh ## path.sh 파일에서 kaldi root 지정 필요

## path.sh 파일 실행하여 작업 수행 위치 지정
. ./path.sh ## 첫번째 .: 이 위치에서 실행한다
. path.sh ## 이렇게 해도 같은 의미

## compute wer
compute-wer ark:ref ark:hyp > wer_results

## utterance 별 error 확인
align-text --special-symbol=“***” ark:ref ark:hyp ark,t:- | utils/scoring/wer_per_utt_details.pl --special-symbol “***” > per_utt_results ## special symbol 사용했을 때 ***을 하나의 token으로 인식해 insertion, deletion을 substitution으로 처리하는 오류 존재
align-text ark:ref ark:hyp ark,t:- | utils/scoring/wer_per_utt_details.pl > per_utt_results ## 이 경우 insertion, deletion에 해당하는 토큰이 <eps>로 나타남

wer_results 파일 결과 예시
per_utt_results 결과 예시

 

'파이썬' 카테고리의 다른 글

kaldi 설치  (1) 2022.10.24