音声可視化の可能性|DJ TOSHIKIのオトノイロ #19
iPhoneのsiriや数多くのアプリが開発され、テレビやドラマの影響もあって認知されてきた音声変換ですが、実際に今どのくらい進化していると思いますか?耳が聞こえない・聞こえにくい方にとって、音声変換の機能はこれまでに考えられないくらいにコミュニケーションの幅を広げたと思います。そして普段の生活のなかでの情報保障としても音声変換は役立てらるようになってきています。
テレビの生放送の字幕ではこれまで人が手入力する方法でしたが、最近ではAIでの音声認識と手入力をつかったハイブリッド方式が使われるようになっているようです。ニュースなどはより正確な情報を伝えないといけないため、人の手で確認と修正が必要ですが、音声認識変換の精度がかなり上がっていることもあり、近い将来はAIのみで生放送でもタイムラグがほとんどなく字幕化出来るようになるかもしれません。
そして今、注目されてきているのが、オノマトペやイラストをつかった視覚化です。
リアルタイム音声認識アプリを開発している「YYSystem」では、周囲の環境音を”見える化”する「雰囲気カメラ」というアプリを開発しています。例えば駅のホームで電車を待っていると、電車が到着する際にアナウンスがあります、その後電車がホームに入ってきて、またアナウンスがあり乗車して次の駅に向かいます。その、一連の音をイラストやテキストなどで視覚化してくれるんです。
音声から情報を得ることが難しい方にとってアナウンスの内容は最も重要なので、これまでもそのようなアプリがあったり、公共交通機関では視覚的に確認出来るような配慮もされてきています。でも、この「雰囲気カメラ」は大切な情報にプラスして環境音も視覚的に表現することで、より周囲の状況を細かく知ることができるんです。しかもイラストをつかったりと「面白さ」の要素もあるので、子供も使いたくなるアプリだと思います。
そして、以前のコラムでも取り上げましたが、駅のホームに設置されたモニターで音声情報を可視化する「エキマトペ」も、名前の通りオノマトペを使って、音の情報をより臨場感を感じられるように工夫されています。このエキマトペはまだ実用化はされていないようですが、2021年から実証実験として実際にJR巣鴨駅やJR上野駅に設置されて話題となりました。
いつか実用化されてどこの駅でも見られるようになると、聞こえない方にとっても安全で楽しい通勤通学になるだろうし、みんなが「障害」について考えるきっかけになるのではないかと思います。
今回、紹介した「雰囲気カメラ」や「オノマトペ」の共通するところは、必要な情報を視覚的に伝えられることはもちろんですが、それに「面白い」「楽しい」という要素も加えられています。社会の中での「障害がある方へ配慮」は今ではたくさんあります。当然どれも必要な物だし、まだまだ改善されていくと思いますが、「面白い、楽しい、かっこいい」といった要素が加わって、みんなが驚くようなものをつくれば「障害」へのイメージも変わり、理解も進んでいくのではないかと思っています。