今日は朝からトレーニングに励んでいる。
トレーニングといってもわたしがトレーニングをするのではなく、トレーナーとして尻を叩く側だ。
その相手とは、PC内臓マイク。
昨日からちょっとだけ「音声認識機能」に興味を持ち始めたわたしは、本日の仕事はすべて音声入力で対応することにした。
その結果、最も効率的だった作業はメールだ。
社労士であるわたしが仕事のメールを送る際、かなりの頻度で使用する「単語」や「文章」というものがある。
それらはクライアントの理解度や年齢、親密さによって表現を変えるため、定型文としての登録はしていない。
そのため「無駄な作業」と感じつつも、毎回キーボードをパチパチ鳴らしながら文章を作っている。
ちなみにわたしのメールは、挨拶に始まりくだらない小ネタからの本題、という流れなので、やはり相手によって内容も表現も変えざるを得ないのだ。
よく使う文章で面倒なのは、
「雇用保険取得(喪失)手続きが終了しました。被保険者通知用をご本人へ交付、事業主通知用は会社保管をお願いします。」
と、
「社会保険資格取得手続きが終了しました。決定通知書を添付しますのでご査収ください。なお、保険証は近日中に法人宛に郵送されますので、カードに記載された内容をご確認いただき、ご本人への交付をお願いします。」
この2つだ。
漢字が多いので、変換ミスも含め文章を作るのが面倒。しかもほぼ毎日このような内容のやり取りが発生するわけで、やはり定型文登録するべきなのだろう。
だがPCだけでなくスマホから送信することもあり、結局のところ毎回手入力しているのが現状。
ところが今日、わたしは現代人としての一歩を踏み出した。
Windows10搭載の「音声認識機能」というやつを起動させた結果、めちゃくちゃスムーズにメール作成ができた。
確かに誤字脱字はあるものの、パソコンに向かって話しながらテキスト修正できるので、一から十までパチパチする手間を考えるとかなり楽なのだ。
しかしメールで頻出する「被保険者用」という言葉、コンピューターが理解できずに「被保険者様」とか「被保険者と尾」などと表示されてしまう。
そこでわたしは、コイツを鍛え上げることにした。
音声認識機能のなかに、
「コンピューターをトレーニングして認識精度を上げる」
という項目があるので、早速クリック。
「Microsoft音声認識はユーザーの話し方を学習します。」
「・・・自然な調子であまり抑揚をつけずに読み上げてください。」
そしてトレーニングテキストが現れる。
ごく普通の文章が次々と出てくるのだが、わたしに対する嫌味、いや、ヒントとなる内容も混じっていたりする。
最初のうちは上手く音声認識されず、なかなか次の文へと進めなかった。ところが途中で現れたトレーニングテキストに、
「テレビキャスターのように明確に発音する必要があります」
と、まるでダメ出しのようなサンプルが混じっており、トレーナー側であるわたしがコンピューターに対して気を使うよう指示された。
その後滑舌よく読み上げると、スイスイ進むようになった。
このトレーニングテキストの内容は、ある種「お告げ」なのかもしれない。
「コンピューターは人間の会話を理解すること、および、人間の会話をシミュレーションすることが要求されます」
つまりわたしの声質、話し方のクセや特徴、よく使う用語などをコンピューターが記憶し学習することで、会話の内容を予測し、より正確な文字変換を行うのだ。
これが可能になれば、確実に「わたし」を上回る人工知能が誕生するだろう。いとも簡単に。
そんな脅威を感じながらも、わたしは2時間ほどコンピューターを特訓してやった。すると最後のほうでは誤字脱字はほとんどなくなり、「被保険者用」とちゃんと変換されるようになった。
しかも早口で言おうが小声でつぶやこうが、キッチリ拾って文字変換している。
ーーたった2時間でここまで成長するのか
そしてトレーニングを終了する際、最後のメッセージはこれだった。
「音声認識トレーニングセッションを終了します」
そう、これはコンピューターとわたしとの「セッション」だったのだ。
*
いま、友人とLINEでやり取りをしている。
PCのみならず、スマホでも音声入力に徹する構えのわたしは、ところどころ誤字を修正しながらもテンポよく会話を続けている。
そんな最中、ふとした拍子にパソコンのモニターが視界に入った。
と同時に、わたしは目を疑った。
メール作成画面にびっしりと、友人との会話が記録されている。まるで議事録のように、膨大な量の文字が書き連ねられているのだ。
理由は簡単。
マイクがオンのままメール作成画面にカーソルが置かれていたため、PCが音声を拾い上げディクテーションが実行されただけのこと。
べつに不思議なことではない。
不思議なことではないのだが、正直、ゾッとした。
確かにコンピューターは賢い。これまでも、SNSのコメントで「ウエイト」という言葉を使えば広告は「ダンベル」が出るし、LINEで「バッテリー」と使えば「バッテリーチャージャー」のおすすめが表示された。
このようにAIは「文字」による学習を重ねてきたが、それに加えて今日からは「音声」での学習も始まるのだろう。
この現象を単純に「便利だ」と喜んでいいものか。
ディストピアがSFの話ではなく、現実味を帯びてきたとしか思えないのだが。
Illustrated by 希鳳
コメントを残す