AISHELL コーパス

人工知能 中国語 会話型AI NLP

製品画像 拡大

メーカー

Beijing Shell Shell Technology Co., Ltd.

ソフトウェア あんしんプラス対象製品? 海外製品の導入に不安のあるお客様をサポートする、年間更新のオプションサービスです。トラブル発生時の回数無制限の「メーカー問い合わせ代行」「導入後のメールサポート」や、「ハードウェア製品の保証期間延長」などのサポートパックをご用意しています。
あんしんプラスの詳細はこちら

AISHELL コーパスの製品概要

中国 AISHELL社 (Beijing Shell Shell Technology Co., Ltd.) の音声コーパスは、 スマートホームや自動車(スマートカー)、ロボットなどのインテリジェント製品向けの音声データに対応したデータセットを提供しています。 中国語音声認識に強みがあり、データは用途シーン別にカテゴライズされています。

また学術研究用途向けのオープンソースコーパスも提供されています。

主な用途
  • 音声認識システムトレーニング
  • 中国語の自然言語処理研究
  • 音声合成のデータベース
  • マルチモーダル学習のためのデータセット
  • 音声アノテーションと解析

AISHELL コーパスの製品仕様

AIShellTech

音声技術の専門家向けの、専門的かつ高度な音声技術製品
多目的で広範な用途に使える中国語をメインとした音声認識のデータセット

製品ベネフィット
  • 広範な中国語データセット
  • 実世界の音声シナリオカバレッジ
  • 多様なアクセントや方言対応
  • 高品質な音声アノテーション
  • 産業/研究双方での利用可能性
データセット
  • AISHELL-1: 読み上げ音声を収録したデータセット。音声認識の基礎研究向け
  • AISHELL-2: 自然な会話音声を含むデータセット。音声アシスタントの開発に適す
  • AISHELL-3: 大規模な多人数話者データを含む、高精度モデル向け
  • AISHELL-4: 会議シーンの多チャンネル音声データ。話者分離や会議の音声認識に最適
データソリューション
  • 音声認識: 音声を文字に変換する技術の開発に必要なデータ
  • 音声合成: テキストを音声に変換するシステム向けのデータ
  • 声紋認識: 話者を識別するためのデータ
  • 自然言語処理(NLP): テキストデータの処理や理解のためのデータ
  • 辞書データ: 言語の発音や意味に関するデータセット
データプロダクトの種類
  • インタラクティブデータ: 双方向の対話システムに最適なデータ
  • シナリオデータセット: 特定のシナリオに基づいた音声やテキストデータ
  • 汎用データセット: 幅広い応用に対応した一般的なデータ
  • オープンソースデータ: 研究用に無料で公開されているデータセット

メーカーサイトURL

https://www.aishelltech.com/

取り扱い製品の一例

シナリオデータセット / 詳細
音声認識の典型的な使用例
  • AISHELL-ASR0010: スマートホーム用音声コマンドコーパス(中国語)
  • AISHELL-ASR0020: スマートホーム用音声コマンドコーパス(英語)
  • AISHELL-ASR0031: 自動車(EV)用コマンドコーパス(中国語)
  • AISHELL-ASR0011: 車両用音声コマンドコーパス(中国語)
  • AISHELL-ASR0012: 知能ロボット(スマートロボット)用音声コマンドコーパス(中国語)
  • AISHELL-ASR0039: スマートホーム用制御言語コーパス(中国語)
  • AISHELL-ASR0070: スマートスピーカー用コーパス(中国語)
  • AISHELL-ASR0015: 実際のノイズシーンコーパス(中国語)
  • AISHELL-ASR0055: 会議用スピーチコーパス(中国語)
  • AISHELL-ASR0037: 会議用スピーチコーパス(中国語)

 


一般的なデータセット / 詳細
中国語標準語音声コーパス
  • AISHELL-ASR0009: 標準語音声コーパス(中国語)
  • AISHELL-ASR0060: 高齢者スピーチコーパス(中国語)
  • AISHELL-ASR0019: 中国児童音声コーパス(英語)
  • AISHELL-ASR0018: 中国児童音声コーパス(中国語)
  • AISHELL-VPR0061: 音声認識コーパス(中国語)
  • AISHELL-VPR0062: 音声認識コーパス(中国語)
  • AISHELL-TTS0013: 感情音声合成コーパス(中国語)
  • AISHELL-ASR0026: 音声コーパス(ヒンディー語)
  • AISHELL-ASR0006: 中国語アクセントの対話(中国語)
  • AISHELL-TTS0006: 中国語 TTS コーパス(中国語)
  • AISHELL-ASR0027: 音声コーパス(カザフ語)
  • AISHELL-ASR0028: 音声コーパス(アラビア語)
  • AISHELL-ASR0029: 音声コーパス(ロシア語)
  • AISHELL-ASR0021: アメリカ英語音声コーパス(英語)

オープンソース

オープンソースコーパス AISHELL-1 / AISHELL-2 は学術研究用途に対して無料で提供されます。
※商用利用の場合は、メーカーからの許可と購入が必要です。

  • AISHELL-1 / 詳細
    収録時間: 178時間
    話者: 400人
    ※中国語標準音声データ AISHELL-ASR0009の一部
  • AISHELL-2 / 詳細
    収録時間 : 1,000時間
    話者: 1,991人
    – 中国語標準音声データ AISHELL-ASR0009- [ZH-CN]の一部 718時間
    – 中国語スマートホームボイスデータ AISHELL-ARS0010- [ZH-CN]の一部 282時間
  • AISHELL-3 / 詳細
    マルチスピーカーの中国語 (北京語) 音声コーパス
    収録時間 : 85時間
    話者: 218人
    発話: 88,035
その他

WakeUp-1 / DMASH / AISHELL-6A / AISHELL-6B / RealMAN

 


EVAL (evaluation)

音声認識モデルの性能評価のためのテストデータセット
トレーニングデータ、バリデーションデータ(開発セット)、テストデータが含まれており、
音声及び話者の認識評価などに使用されます

AISHELL-2018 / 詳細
  • AISHELL-2018A-EVAL
    テストデータ(Test Data): 10人による5,000の発話
    開発セット(DEV Data): 5人による2,500の発話
    サンプリングレート:16kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:PCM

 

AISHELL-2019 / 詳細

  • AISHELL-2019A-EVAL
    遠近マイク音声コーパス
    テストデータ(Test Data): 50人の話者による録音
    収録時間:24.3時間
    サンプリングレート:44.1kHz & 16kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:WAV
  • AISHELL-2019B-EVAL
    スマートアシスタント起動音声データベース(ウェイクアップワード)
    テストデータ(Test Data): 86人の話者による録音
    収録時間:437.67時間
    サンプリングレート:44.1kHz & 16kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:WAV
  • AISHELL-2019C-EVAL
    Alcorrect(瞬間双方向音声翻訳機)音声コーパス
    テストデータ(Test Data): 12人の話者による録音
    収録時間:31.2時間
    サンプリングレート:44.1kHz & 16kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:WAV

 


AISHELL-2021 / 詳細
  • AISHELL-2021A-EVAL: 車載用音声コマンドテストデータセット(EV)
    テストデータ(Test Data): 2066人の話者による録音
    収録時間:7.2時間
    サンプリングレート:16kHz / サンプルフォーマット:16bit / 車両 / データタイプ:WAV
  • AISHELL-2021B-EVAL: スマートホーム用遠距離音声テストデータセット
    テストデータ(Test Data): 30人の話者による録音
    収録時間:15.8時間
    サンプリングレート:16kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:WAV
  • AISHELL-2021C-EVAL: 中国語の児童による音声テストデータセット
    テストデータ(Test Data): 1117人の話者による録音
    収録時間:2.18時間
    サンプリングレート:16kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:WAV
  • AISHELL-2021D-EVAL: 中国語(会話)の音声テストデータセット
    テストデータ(Test Data): 6人の話者による録音
    収録時間:1.95時間
    サンプリングレート:8kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:WAV
  • AISHELL-2021E-EVAL: 裁判傍聴シーン音声テストデータセット
    収録時間:1時間
    サンプリングレート:16kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:WAV

AISHELL-2022 / 詳細
  • AISHELL-2022A-EVAL: 日本語(会話)のテストデータセット
    収録時間:1時間
    サンプリングレート:16kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:WAV
  • AISHELL-2022B-EVAL: 英語(会話)のテストデータセット
    収録時間:1時間
    サンプリングレート:16kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:WAV
  • AISHELL-2022C-EVAL: 北京語(中国語)マルチチャネル会議音声テストデータセット
    収録時間:12.72時間
    サンプリングレート:16kHz / サンプルフォーマット:16bit / 屋内 / データタイプ:WAV

※製品の仕様などは変更となる場合がございます。ご了承ください。

 

検索キーワード:
エイアイシェルテック / AIShellTech 音声データセット / 中国語 音声認識 コーパス / AIShell 音声合成データ / AIShellTech ダウンロード / AIShell 研究用データベース / アノテーション / Corpus annotation / 研究用付加情報 / 形態素解析(Morphological analysis) / 自然言語処理 / 構文解析 / ツリーバンク / 大規模注釈付き / ASR / VPR / / NLP / Lexicon / TTS / レキシコン / コンピュータビジョン / OCR / 自動運転 / 音声合成 / 音声認識(Voice Print recognition) / AISHELL-ASR0010 / AISHELL-ASR0020 / AISHELL-ASR0031 / AISHELL-ASR0011 / AISHELL-ASR0012 / AISHELL-ASR0009 / AISHELL-ASR0018 / AISHELL-ASR0026 / AISHELL-1 / AISHELL-2 / AISHELL-EVAL / AISHELL-2019A-EVAL / AISHELL-2019B-EVAL / AISHELL-2019C-EVAL / AISHELL2-2018A-EVAL

横にスクロールできます
商品名 納品方法 納期 価格
電子デリバリー お問い合わせください お問い合わせください

ご希望の商品にチェックを入れてボタンをクリックすることで、
該当商品をお見積もりフォームへ追加できます。

お見積もり依頼・お問い合わせ
STEP 01

WEBサイト内より商品を検索

「探す」ページより、ご希望の商品を検索してください。
ご希望の商品が見つかりましたら、商品名をクリックし詳細ページをご覧ください。

検索アイコン
STEP 02

商品詳細ページをご確認ください

表示された商品情報をご覧いただき、商品内容やエディション、価格などをご確認ください。
ご希望の商品名のチェックボックスにチェックを入れていただくと商品名がフォームに自動入力されます。

検索アイコン
STEP 03

フォームにて見積もり依頼

ここで商品名や数量、ご希望のオプションやその他のご要望、ご質問、
お客様情報など必要事項をご記入いただき、「送信する」ボタンを押してください。

検索アイコン
STEP 04

弊社スタッフよりお見積もりをお送りしますので、
メールにてご注文ください

お客さまからのお問い合わせを受理しだい、弊社スタッフよりお見積もりをメールにてお送りします。
お見積もり内容をご確認後、ご注文いただけるようでしたら、弊社からのお見積もりメールへのご返信にて、ご注文の旨をお知らせください。

検索アイコン
STEP 05

商品を配送、またはメールにてお届け

ハードウェア、パッケージソフトウェア等は弊社より宅配便でお届けいたします。
ご注文いただいた商品がダウンロードソフトウェアやライセンス、レポート等の場合は「電子デリバリー」にてお届けいたします。

検索アイコン

 

ご注文の流れの詳細はこちら

※ 返品・交換について
海外製品のため、ご注文後のキャンセル、ご返品はお受けできません。
ただし「納品後一週間以内」の初期不良品については、正常動作の同品もしくは同等品と無償交換させていただきます。
万一在庫切れの場合は同等品交換もしくは全額返金いたします。

ユニポスはAISHELL コーパスの調達販売を行い、海外製品調達に関するお困りごとを解決するサービスです。 詳しくはこちら。

法人掛売り(※)

納品・請求書による後払いです。
ご注文手続きはお見積もりメールへの返信のみでけっこうです。

銀行振込

ご注文の返信メールをいただいた後、弊社指定の銀行口座へのお振込みを確認した時点で注文の確定とさせていただきます。

※法人掛売りでのお支払いについては一定の条件がございます。
お支払い方法の詳細はお見積もりメールに記載しておりますので、ご確認ください。

AISHELL コーパスを
ご覧の方におすすめの商品