情報技術科 No.15 澤木康太
①研究の背景
授業でタイマーについて習ったときに他にも機能を付けられるのなら付けてみたいと思った。
音声認識でタイマーが作成できたら、何か作業しながらタイマーを使用でき、便利なのではないかと思った。
さらに新型コロナウイルスへの感染の危険がある今の時代、非接触は重要だと思ったため、音声での入力とした。
②仮説とねらい
高機能、多機能なタイマーを作成するためラズベリーパイを用いる。
③研究内容
音声入力によって非接触でタイマーをセットし、スタートするタイマーの開発。
④技術的知識
Juliusという音声認識ライブラリがあるため、それを利用して音声認識のシステムを作成する。
⑤取り組んだ内容
GPIOをプログラムによる制御が必要になるため今回はpythonで必要な知識を身につける。
juliusでも独自の文法があるためそれについては開発を進めながら必要に応じて追加していく。
以下実際の動作
1.Juliusをmoduleモードで起動
Juliusのオプション-moduleをつけることでJuliusを音声認識サーバーとして話した言葉を別のプログラムにxml形式で送ることができる。
2.Pythonプログラムを起動
socket通信でJuliusサーバーから話した言葉を受け取るためのコード
3.Juliusからデータ受信
strTempという変数に話した言葉のデータが格納される。
4.送られた言葉により処理開始
⑥結果
タイマーと呼べるかは怪しいが音声認識で操作することはできた。
SDカードの破損によるデータの全損がなければGUIでのタイマープログラムの作成や音の追加などできたのが悔しいところ。
一般的なタイマーの場合、電池式で電池の寿命により交換の必要があるが、ラズベリーパイを用いることにより、電池の交換の必要がなく恒久的に動作させることが可能である。
⑦感想・考察
音声認識の機能を実装すること自体は簡単であったが、認識率が悪くとても実用的ではなかったところから辞書を作るなど工夫をしていくことが難しかった。
ほかにも、身の回りの音声認識システムの製品は合言葉のようなものを決めていて、その言葉を認識すると音声認識がスタートするような仕組みになっているが、今回それも方法がわからずできなかった。
そのため身の回りにある音声認識を用いたシステムのすごさを実感した。