개요

우리의 메인 기능인 음성인식을 구현하기 위해 STT를 붙이려고 한다.

우리가 선택한 API는 네이버에서 제공하는 CLOVA Specch Recognition 이다.

선택한 이유는 단순하다. 한국어 정확도가 그나마 가장 정확하다고 한다! (정확도 95% 이상)

(https://velog.io/@team_vino/4번 참고)

따라서 해당 글은 STT를 붙이면서 필요한 내용들을 기록한 포스트이다.

일단 목표로는, 단순히 음성 파일 요청하면 Text로 변환하는 것부터 해서, 차차 확장해 나갈 예정이다.

준비

API 사용 준비

image.png

일단 다 그렇지만, 애플리케이션을 등록해야한다.

image.png

대충 채워준다.

image.png

여기서 Client ID, Client Secret 기억해준다.

개발