음성 데이터 Download

Develop/DataSet

퓨림노 2020. 6. 13. 18:24

728x90

Introduction

음성 데이터는 여러 산업분야에서 활용이 가능하지만, 특히, 사용자와의 상호작용을 통해 특정명령을 수행하기에 좋은 기능입니다. 그리고 사용자와의 대화를 통해 추가 정보를 획득할 수 도 있죠.

이런 음성데이터들도 어떤 데이터셋이 있는지 하나씩 살펴보도록 할까요?

A curated list of Japanese, Korean and Vietnamese open speech corpora Dataset

먼저 위의 블로그를 통해 접속을 하게 되면, 일본어,한국어,베트남 공개연설과 관련된 자료로서 각각 다운 받을 수 있습니다.

KSS datset

위의 페이지를 접속하게되면, 각 연설문에 대한 음성파일이 정리되어나와있습니다. 용량이 4G정도면 크지 않으니, 부담되지는 않을 것으로 생각되네요. 그리고 kaggle 등에 참가해서 다른 사람과 경쟁하는것도 좋은 공부라고 생각됩니다.

아래의 두 데이터셋은 꼼꼼하게 확인을 하지는 못했지만, 자료 정리가 잘되어있는 것 같아 살펴보시는것도 좋을 것이라 생각됩니다.

Zeroth Korean

Pansori-TEDxKR

728x90