2023-02-01から1ヶ月間の記事一覧

Pythonでストリーミング音声認識をやってみた (Google Cloud Speech-to-Text API V1)

GCPに音声認識APIがあることを知識としては知っているけど、あんまり使ったことがなかったので使ってみました。 Speech-to-Text API V1の音声認識方法には「同期認識」「非同期認識」「ストリーミング認識」の3種類があります。 ネットで見かけるサンプルは…

Pythonでウェイクワード検出をやってみた (picovoice社 Porcupine)

ウェイクワードは「アレクサ」や「OK Google」みたいな音声認識を開始するための言葉。 そのウェイクワード検出がしたくなったので、前々から気になっていたpicovoice社のPorcupine(ポーキュパイン)を使ってみました。 Porcupineは日本語に翻訳すると「やま…