ホーム > ソフトウェア > 人文学・社会科学 > AISHELL コーパス
AISHELL コーパス
- 人工知能向けの中国語コーパス
- 中国 Beijing Shell Shell Technology社の取り扱っている、スマートホームや自動車(スマートカー)、ロボットといった音声によるインテリジェント製品向けの音声コーパス。データは用途シーン別にカテゴライズされています。
また学術研究用途向けのオープンソースコーパスも提供されています。
Datasets :
AISHELL-ASR0010 / AISHELL-ASR0020 / AISHELL-ASR0031 / AISHELL-ASR0011 / AISHELL-ASR0012 / AISHELL-ASR0009 / AISHELL-ASR0018 / AISHELL-ASR0026 / AISHELL-1 / AISHELL-2 / AISHELL-EVAL / AISHELL-2019A-EVAL / AISHELL-2019B-EVAL / AISHELL-2019C-EVAL / AISHELL2-2018A-EVAL
検索キーワード:
アノテーション / Corpus annotation / 研究用付加情報 / 形態素解析(Morphological analysis) / 自然言語処理 / 構文解析 / ツリーバンク / 大規模注釈付き / ASR / VPR / / NLP / Lexicon / TTS / レキシコン / コンピュータビジョン / OCR / 自動運転 / 音声合成 / 音声認識(Voice Print recognition)
- メーカー
- Beijing Shell Shell Technology Co.、Ltd.
http://www.aishelltech.com/
取り扱い商品の一例
商品名 | 納品方法 | 納期 | 価格 | |
---|---|---|---|---|
AISHELL コーパス (ご希望の製品名や型番をお知らせください) | 電子デリバリー | お問い合わせください | お問い合わせください |
ご希望の商品にチェックを入れてボタンをクリックすることで、該当商品をお見積もりフォームへ追加できます。納品方法についてはこちらをご覧ください。
商品説明
【取り扱い製品の一例】
・シーン別ボイスデータ / 詳細
・スマートホームボイスデータ
…中国語 - AISHELL-ASR0010
…英語 - AISHELL-ASR0020
・中国語 スマートカー音声データ
…電気自動車 - AISHELL-ASR0031
…燃料車 - AISHELL-ASR0011
・中国語 知能ロボット音声データ
- AISHELL-ASR0012
・基礎ボイスデータ / 詳細
・中国語 標準音声データ
- AISHELL-ASR0009
・中国語 子供の声データ
- AISHELL-ASR0018
・ヒンディー語 音声データ
- AISHELL-ASR0026
---------------------------------------------
以下のオープンソースコーパス AISHELL-1 / AISHELL-2 は
学術研究用途に対しては無料で提供されますが、商用での利用の場合には
メーカーからのPermissionを受け、購入をする必要があります。
AISHELL-1 / 詳細
収録時間 : 178時間
- 中国語標準音声データ AISHELL-ASR0009の一部
スピーカー数 : 400人
AISHELL-2 / 詳細
収録時間 : 1,000時間
- 中国語標準音声データ AISHELL-ASR0009- [ZH-CN]の一部 718時間
- 中国語スマートホームボイスデータ AISHELL-ARS0010- [ZH-CN]の一部 282時間
スピーカー数 : 1,991人
AISHELL-EVAL
・AISHELL-2019A-EVAL / 詳細
家庭環境遠・近距離同調用音声データベース
収録時間 72.5時間
スピーカー数 : 150人
・AISHELL-2019B-EVAL / 詳細
スマートアシスタント起動音声データベース
収録時間 426.8時間
スピーカー数 : 86人
・AISHELL-2019C-EVAL / 詳細
翻訳機用音声データベース
収録時間 35.8時間
スピーカー数 : 12人
・AISHELL2-2018A-EVAL / 詳細
TESTデータ : 10人による5,000の発声
DEVデータ : 5人による2,500の発声