ミニレポート
音声コマンドでLightroom Classicの操作に挑戦。Qbellの音声認識アシスタントソフト「アイリス」
2021年6月15日 07:00
写真愛好家のコミュニティでは、グラフィックソフトを音声で操作するという取り組みはあまり馴染みがない。一方、イラスト制作者向けには「音声認識アシスタント」と呼ばれるソフトが存在し、複雑なショートカット操作に代わって、“しゃべる”だけでソフトを操作することができる。
今回、Qbell(キュウベル)が開発・販売している音声認識アシスタントソフト「アイリス」を試用する機会を得たので、Adobe Lightroom Classicの音声コマンドによる操作に挑戦してみた。新製品というわけではなく、発売は2018年だ。
このアイリスも本来イラスト制作者向けのもので、メジャーなグラフィックソフト「CLIP STUDIO PAINT」(クリップスタジオペイント)での使用を前提としたものとなっている。
しかし、認識フレーズとそれに対応するショートカットキーを自分で設定すれば汎用的に使えるので、Lightroomでの作業効率が上がるのではないかと思った次第だ。
製品としては、上位版の「アイリス」(税込5,500円)と音声コマンドの作成上限数を抑えた「タンポポ」(同1,100円)がラインナップされている。対応OSはWindows 10で、Mac版は開発中とのことだ。なお、タンポポには無料版もあるが、音声コマンドの編集ができないので、汎用的には使えないようだ。
まずは音声コマンドを登録
インストールして起動すると、切り株に座った女の子が現れた。いわば、デスクトップマスコットの様な外観のソフトで、なかなかかわいらしい。
メーカーでは外付けマイクの使用を推奨しているので、今回はデスクトップPCにマイクを接続して使った。まず、アイリスを右クリックして「音声認識」にチェックを入れておく。
続いて「環境設定」→「基本設定」で、使用するグラフィックソフトを指定する。デフォルトではCLIP STUDIO PAINTになっているが、筆者は使っていないのでその部分にLightroomの実行ファイルを設定した。
なお、この他にプロファイルという形で10本までのソフトを登録可能だ。すると、それぞれ別の音声コマンドを設定できるようになる。
続いて「環境設定」→「ショートカット設定」でLightroomの音声コマンドを設定する。当然ながらLightroomのショートカットは全く登録されていないため、イチから入力することになる。
「プロファイル」のところでLightroom.exeを選んでおく。デフォルトではCLIP STUDIO PAINTに対応した音声コマンドが登録されているので、誤動作を防ぐため「すべて削除」を押して一旦ショートカットをクリアした。ただ、最初から登録されているコマンドの項目自体を消すことはできないようなので、そのまま残しておいた。
Lightroomのコマンドだとわかりやすいように「グループラベル追加」を押してLightroomというラベルを作成。その中にコマンドを追加することにした。「コマンド追加」を押すと、コマンド追加のダイアログが出てくる。
ここで例として次のように設定した。「ラベル」は設定画面上での表示名。「メッセージ」はコマンドが実行されたときにアイリスが返す文言だが、特に設定しなくても動作に問題はない。入力が手間なので、一部を除いて省略している。
その下の「音声コマンド」だが、「命令」には認識させたい言葉を入れる。「読み」は平仮名で入力。そして右にあるプラスボタンを押すとコマンドが登録される。
1つのショートカットに対して、”読み”は幾つも割り当てられる。つまり、「ズーム」「拡大」「大きく」などを登録しておけば、どれを喋っても拡大が実行されることになる。
なお”読み”は2文字以上が推奨されていて、黄色のラベル設定を「き」としたらうまく認識されず、「きいろ」にしたところうまくいった。
「OK」を押してコマンド追加のダイアログを閉じると今登録したコマンドが表示されるので、その隣をクリックして設定したいショートカットキーを押す。「Ctrl+A」などは実際の押し方で入力できる。
この流れを繰り返して必要なコマンドを登録していく。一通り登録できたら「保存」→「OK」と押せば、準備は完了である。
今回は使用していないがマクロ記録も可能となっており、音声コマンドでマクロを実行できるそうだ。
キーボードに目を落とさずに操作できる
アイリスを立ち上げた状態でLightroomを起動すれば、音声操作が可能になっている。デフォルトでは「アイリス、【指定の音声コマンド】」の発音操作で命令が実行される。だが、毎回アイリスの名前を呼ぶのは面倒なので、連続モードに切り替えておくと良い。これは始めに「アイリス、連続モード」と発音しておくと、その後は【指定の音声コマンド】の発音のみで動作するモードだ。
以下は実際に操作した画面の録画だ。
思った以上にレスポンスが良くしっかり認識してくれた。今回は20ほどのコマンドを登録して使ってみたが誤認識というのはなかった。ちなみにアイリスの音声認識には、オープンソースの汎用大語彙連続音声認識エンジン「Julius」が採用されている。JuliusのWebサイトによると、認識率は90%以上という。
Windows 10に標準搭載されている音声認識機能と違って、文章の読み上げ入力などはできないが、Qbellによると、ショートカットキーの操作に特化することで高速な認識を実現しているそうだ。
今回アイリスを使ってみてわかったのは、音声で操作できると画面を見続けながら作業ができるということだ。文章ならキーボードを見ずに入力できる筆者だが、ショートカットキーのときはどうしてもキーボードを見てしまう。これが眼や首の余計な動きを生んで時間のムダや疲れに繋がっているところもあるだろう。画面を見続けられるというのは結構快適だということがわかった。
留意点としては、自宅で1人作業をするときは良いがオフィスなどでは使いづらいと思う。また、ヘッドホンなら良いが、スピーカーで音楽などを聞きながらだと認識率はかなり落ちる(音量によっては使えないこともなかったが)。そしてショートカットキーの登録作業が少々骨であるが、これは1度だけなので一気にやってしまいたいところ。
スマートフォンやスマートスピーカーの普及で、音声操作というものも身近になった。次はPCのソフトを音声で動かしてみるのも面白いと思う。音声操作がハマる人とそうでない人はいると思うので、まずは体験版で試してみるとよいだろう。