2019. 12. 4. 13:13ㆍ실천해본것들
안드로이드에서 오디오 파일을 음성인식해서 텍스트로 출력하는 기능을 만들고 싶다.
하지만 많은 예제들은 음성을 실시간으로 짧게 인식한다.
https://dsnight.tistory.com/15
https://medium.com/wasd/creating-an-android-google-stt-application-4cea24ee97af
이런 예제도 있다.
나는 여러 문장들로 이루어져 있으면서 문장간 호흡이 긴 음성을 글자로 만드는 것을 생각하고 있는데, 음성인식은 한 호흡만을 바로 문장으로 만들고 기능을 종료하는 것 같았다. 공짜기능을 쓰기 때문에 그런것 같다.
https://blog.naver.com/skelentom/10167064677
근데 여기선 speech recognizer를 이용해 값을 여러번 받고 그것을 나중에 합치는 사람이 있는것 같았다. asynctask를 통해 한다고 했다.
https://stackoverflow.com/questions/6989981/speech-to-text-from-own-sound-file
http://blog.naver.com/PostView.nhn?blogId=skelentom&logNo=10167054858
이것은 여러 결과물을 보여주는 예제다. 한 문장을 음성인식 해서 가능한 결과물들을 여러개 출력하는 것.
여기서 내가 고민하는 문장간 호흡이 길때 어떻게 해야하는지에 대해서 방법을 2가지 제시 했다.
1. 음성인식이 끝날때 다시 음성인식을 시작하는것.
2. 연속 음성인식 라이브러리를 사용하는것
https://stackoverflow.com/questions/30281651/continuous-speech-recognition-android-without-gaps
2번의 연속 음성인식 라이브러리는 CMU sphinx다
https://sourceforge.net/projects/cmusphinx/
아쉬운것은 한국어를 직접적으로 지원하지 않는다는거. language model을 직접 만들어야 하는데, 시간이 없다.
https://github.com/sachinvarma/Speech-Recognizer
요게 있었다. 이사람 것은 continuous speech recognition을 speech recognizer로 구현한 것
다만 26 이전 버전이라서 26 이상 상위버전의 앱에서는 service의 background 실행제한이 걸린다.
https://www.youtube.com/watch?v=FbpD5RZtbCc
forground 실행하기 위해서 notification 설정을 해주고....
https://www.sitepoint.com/a-step-by-step-guide-to-building-an-android-audio-player-app/
manifest에도 service 등록을 해준다.
나는 manifest등록 안해준 것을 깜박해서 개 고생했다.
검색어
android voice recognition
speechrecognizer stt
continuous speech recognition android
continuous speech recognition speechrecognizer
'실천해본것들' 카테고리의 다른 글
install PyQt designer (0) | 2020.07.24 |
---|---|
GCP - Kubernetes 예시 사용해보기(GKE) (0) | 2020.07.17 |
(legacy-170720) Google Speech API quick start (0) | 2020.07.14 |
안드로이드 진동 감지, 가속도계, 진동 발생 (0) | 2020.03.08 |
리사이클러 뷰에 크롤링한 결과 표시하기 (0) | 2019.12.09 |