파이썬
Kaldi를 사용하여 decoding 결과 분석하기
ppoqq
2022. 11. 14. 12:30
Prerequisites: ref, hyp 파일
cd /kaldi/egs/wsj/s5 ## 해당 폴더 내에 존재하는 kaldi에서 제공하는 toolkit 사용
vi path.sh ## path.sh 파일에서 kaldi root 지정 필요
## path.sh 파일 실행하여 작업 수행 위치 지정
. ./path.sh ## 첫번째 .: 이 위치에서 실행한다
. path.sh ## 이렇게 해도 같은 의미
## compute wer
compute-wer ark:ref ark:hyp > wer_results
## utterance 별 error 확인
align-text --special-symbol=“***” ark:ref ark:hyp ark,t:- | utils/scoring/wer_per_utt_details.pl --special-symbol “***” > per_utt_results ## special symbol 사용했을 때 ***을 하나의 token으로 인식해 insertion, deletion을 substitution으로 처리하는 오류 존재
align-text ark:ref ark:hyp ark,t:- | utils/scoring/wer_per_utt_details.pl > per_utt_results ## 이 경우 insertion, deletion에 해당하는 토큰이 <eps>로 나타남