【Pythonアプリ入門】音声認識アプリを作る方法(SpeechRecognition)

Python
けんろう
けんろう

この記事では、Pythonで音声認識アプリの作り方を紹介します。 

Pythonは「SpeechRecognition」というライブラリを使うと、音声認識アプリを簡単に作ることができます。

この記事に載っているサンプルコードをコピーして、Pythonで実行すれば、簡単に動きを確認できますので、是非試してみて下さい。

この記事では、初心者にもわかりやすいように、各処理の内容を、サンプルコード内にコメントとして載せています。

Freeks(フリークス)|業界初!10,780円のサブスク型プログラミングスクールの無料説明会
スポンサーリンク

今回作成するアプリ

今回作成するアプリは、

PCのマイクに話しかけた言葉を、コンソール上に文字として表示します。

それでは、SpeechRecognitionを利用した音声認識のサンプルアプリを作ってみましょう

事前準備

SpeechRecognitionライブラリをインストールします。

次に、pyaudioライブラリをインストールします。pyaudioは、オーディオIOライブラリです。

pip install SpeechRecognition

pip install pyaudio

以下のサンプルコードをコピーして、ご自身のエディターに貼り付けてください

サンプルコード

#!usr/bin/env python
# -*- coding: utf-8 -*-

import speech_recognition as sr

if __name__ == "__main__":

    r = sr.Recognizer()
    mic = sr.Microphone()

    while True:
        print("なにか話してください ...")

        with mic as source:
            r.adjust_for_ambient_noise(source) #ノイズ除去
            audio = r.listen(source)

        print ("認識中...")

        try:
            print(r.recognize_google(audio, language='ja-JP'))

            # "ストップ"と発話することで、プログラムを止める
            if r.recognize_google(audio, language='ja-JP') == "ストップ" :
                print("プログラムを終了します")
                break

        except sr.UnknownValueError:
            print("認識できなかった。。。。。")
        except sr.RequestError as e:
            print("Could not request results from Google Speech Recognition service; {0}".format(e))

動かし方

サンプルコードを動かすには、コンソール上で、以下のコマンドを入力してください。

python sample.py

実行すると、コンソール上に、以下が表示されます。

なにか話してください ...

PCのマイクに、なにか話してみてください

なにか話してください ...
認識中...
こんにちは こんにちは
なにか話してください ...

\ Pythonを勉強するなら、環境構築が楽で安いラズパイがオススメです /

まとめ

今回は、speechRecognitionライブラリを使って、音声認識アプリの作り方を紹介しました。

コメント

タイトルとURLをコピーしました