음성 데이터 Download
- Develop/DataSet
- 2020. 6. 13.
반응형
728x90
반응형
Introduction
음성 데이터는 여러 산업분야에서 활용이 가능하지만, 특히, 사용자와의 상호작용을 통해 특정명령을 수행하기에 좋은 기능입니다. 그리고 사용자와의 대화를 통해 추가 정보를 획득할 수 도 있죠.
이런 음성데이터들도 어떤 데이터셋이 있는지 하나씩 살펴보도록 할까요?
A curated list of Japanese, Korean and Vietnamese open speech corpora Dataset
먼저 위의 블로그를 통해 접속을 하게 되면, 일본어,한국어,베트남 공개연설과 관련된 자료로서 각각 다운 받을 수 있습니다.
KSS datset
위의 페이지를 접속하게되면, 각 연설문에 대한 음성파일이 정리되어나와있습니다. 용량이 4G정도면 크지 않으니, 부담되지는 않을 것으로 생각되네요. 그리고 kaggle 등에 참가해서 다른 사람과 경쟁하는것도 좋은 공부라고 생각됩니다.
아래의 두 데이터셋은 꼼꼼하게 확인을 하지는 못했지만, 자료 정리가 잘되어있는 것 같아 살펴보시는것도 좋을 것이라 생각됩니다.
Zeroth Korean
-
Description: Audio data of Project Zeroth for Korean Speech Recognition
-
Type: Multiple speakers (Crowdsourcing)
-
Amount: 76.6 hours, 35139 utterances, 137 speakers, 16472 unique sentences
-
Audio quality: crowdsourcing using MoreCoin (Android phone record devices)
-
License: CC BY 4.0
-
Link: Zeroth Project, alias: Openslr - Zeroth Korean
-
Release year: 2018
Pansori-TEDxKR
-
Description: Korean speech corpus generated from Korean language TEDx talks
-
Type: Multiple speakers (TEDx talks)
-
Amount: ~3 hours, 41 speakers
-
Audio quality: 16kHz, TEDx talks
-
License: CC BY-NC-ND 4.0
-
Link: Pansori TEDxKR Corpus, alias: Openslr - Pansori-TEDxKR
-
Release year: 2019
728x90
반응형
'Develop > DataSet' 카테고리의 다른 글
Faces Detection Dataset (0) | 2020.06.13 |
---|---|
CITYSCAPES Dataset Download (0) | 2020.06.13 |
ImageNet Dataset download (0) | 2020.06.13 |
Qucik, Draw! The Data Dataset (0) | 2020.06.13 |
Pedestrian Dataset Download (0) | 2020.06.13 |
Visual Tracker Benchmark Dataset Download (0) | 2020.06.13 |