Develop/DataSet

음성 데이터 Download

퓨림노 2020. 6. 13. 18:24
728x90
반응형
 
 
Introduction

 음성 데이터는 여러 산업분야에서 활용이 가능하지만, 특히, 사용자와의 상호작용을 통해 특정명령을 수행하기에 좋은 기능입니다. 그리고 사용자와의 대화를 통해 추가 정보를 획득할 수 도 있죠. 
 
이런 음성데이터들도 어떤 데이터셋이 있는지 하나씩 살펴보도록 할까요?
 
 
 
A curated list of Japanese, Korean and Vietnamese open speech corpora Dataset

 
 
먼저 위의 블로그를 통해 접속을 하게 되면, 일본어,한국어,베트남 공개연설과 관련된 자료로서 각각 다운 받을 수 있습니다. 
 
 
KSS datset

 
 
 
위의 페이지를 접속하게되면, 각 연설문에 대한 음성파일이 정리되어나와있습니다. 용량이 4G정도면 크지 않으니, 부담되지는 않을 것으로 생각되네요. 그리고 kaggle 등에 참가해서 다른 사람과 경쟁하는것도 좋은 공부라고 생각됩니다. 
 
 
 
아래의 두 데이터셋은 꼼꼼하게 확인을 하지는 못했지만, 자료 정리가 잘되어있는 것 같아 살펴보시는것도 좋을 것이라 생각됩니다. 
 
 
 
Zeroth Korean

 
  • Description: Audio data of Project Zeroth for Korean Speech Recognition
  • Type: Multiple speakers (Crowdsourcing)
  • Amount: 76.6 hours, 35139 utterances, 137 speakers, 16472 unique sentences
  • Audio quality: crowdsourcing using MoreCoin (Android phone record devices)
  • License: CC BY 4.0
  • Release year: 2018
 
Pansori-TEDxKR

 
  • Description: Korean speech corpus generated from Korean language TEDx talks
  • Type: Multiple speakers (TEDx talks)
  • Amount: ~3 hours, 41 speakers
  • Audio quality: 16kHz, TEDx talks
  • License: CC BY-NC-ND 4.0
  • Release year: 2019
 
 
728x90
반응형