Learning WARNING

Pocket

 

今日は朝からトレーニングに励んでいる。

トレーニングといってもわたしがトレーニングをするのではなく、トレーナーとして尻を叩く側だ。

 

その相手とは、PC内臓マイク。

 

昨日からちょっとだけ「音声認識機能」に興味を持ち始めたわたしは、本日の仕事はすべて音声入力で対応することにした。

 

その結果、最も効率的だった作業はメールだ。

 

社労士であるわたしが仕事のメールを送る際、かなりの頻度で使用する「単語」や「文章」というものがある。

それらはクライアントの理解度や年齢、親密さによって表現を変えるため、定型文としての登録はしていない。

 

そのため「無駄な作業」と感じつつも、毎回キーボードをパチパチ鳴らしながら文章を作っている。

ちなみにわたしのメールは、挨拶に始まりくだらない小ネタからの本題、という流れなので、やはり相手によって内容も表現も変えざるを得ないのだ。

 

よく使う文章で面倒なのは、

「雇用保険取得(喪失)手続きが終了しました。被保険者通知用をご本人へ交付、事業主通知用は会社保管をお願いします。」

と、

「社会保険資格取得手続きが終了しました。決定通知書を添付しますのでご査収ください。なお、保険証は近日中に法人宛に郵送されますので、カードに記載された内容をご確認いただき、ご本人への交付をお願いします。」

この2つだ。

 

漢字が多いので、変換ミスも含め文章を作るのが面倒。しかもほぼ毎日このような内容のやり取りが発生するわけで、やはり定型文登録するべきなのだろう。

だがPCだけでなくスマホから送信することもあり、結局のところ毎回手入力しているのが現状。

 

ところが今日、わたしは現代人としての一歩を踏み出した。

Windows10搭載の「音声認識機能」というやつを起動させた結果、めちゃくちゃスムーズにメール作成ができた。

 

確かに誤字脱字はあるものの、パソコンに向かって話しながらテキスト修正できるので、一から十までパチパチする手間を考えるとかなり楽なのだ。

 

しかしメールで頻出する「被保険者」という言葉、コンピューターが理解できずに「被保険者」とか「被保険者と尾」などと表示されてしまう。

 

そこでわたしは、コイツを鍛え上げることにした。

 

音声認識機能のなかに、

「コンピューターをトレーニングして認識精度を上げる」

という項目があるので、早速クリック。

 

「Microsoft音声認識はユーザーの話し方を学習します。」

「・・・自然な調子であまり抑揚をつけずに読み上げてください。」

 

そしてトレーニングテキストが現れる。

ごく普通の文章が次々と出てくるのだが、わたしに対する嫌味、いや、ヒントとなる内容も混じっていたりする。

 

最初のうちは上手く音声認識されず、なかなか次の文へと進めなかった。ところが途中で現れたトレーニングテキストに、

「テレビキャスターのように明確に発音する必要があります」

と、まるでダメ出しのようなサンプルが混じっており、トレーナー側であるわたしがコンピューターに対して気を使うよう指示された。

 

その後滑舌よく読み上げると、スイスイ進むようになった。

 

このトレーニングテキストの内容は、ある種「お告げ」なのかもしれない。

「コンピューターは人間の会話を理解すること、および、人間の会話をシミュレーションすることが要求されます」

つまりわたしの声質、話し方のクセや特徴、よく使う用語などをコンピューターが記憶し学習することで、会話の内容を予測し、より正確な文字変換を行うのだ。

 

これが可能になれば、確実に「わたし」を上回る人工知能が誕生するだろう。いとも簡単に。

 

そんな脅威を感じながらも、わたしは2時間ほどコンピューターを特訓してやった。すると最後のほうでは誤字脱字はほとんどなくなり、「被保険者」とちゃんと変換されるようになった。

しかも早口で言おうが小声でつぶやこうが、キッチリ拾って文字変換している。

 

ーーたった2時間でここまで成長するのか

 

そしてトレーニングを終了する際、最後のメッセージはこれだった。

「音声認識トレーニングセッションを終了します」

 

そう、これはコンピューターとわたしとの「セッション」だったのだ。

 

 

いま、友人とLINEでやり取りをしている。

PCのみならず、スマホでも音声入力に徹する構えのわたしは、ところどころ誤字を修正しながらもテンポよく会話を続けている。

 

そんな最中、ふとした拍子にパソコンのモニターが視界に入った。

と同時に、わたしは目を疑った。

 

メール作成画面にびっしりと、友人との会話が記録されている。まるで議事録のように、膨大な量の文字が書き連ねられているのだ。

 

理由は簡単。

マイクがオンのままメール作成画面にカーソルが置かれていたため、PCが音声を拾い上げディクテーションが実行されただけのこと。

べつに不思議なことではない。

 

不思議なことではないのだが、正直、ゾッとした。

 

確かにコンピューターは賢い。これまでも、SNSのコメントで「ウエイト」という言葉を使えば広告は「ダンベル」が出るし、LINEで「バッテリー」と使えば「バッテリーチャージャー」のおすすめが表示された。

このようにAIは「文字」による学習を重ねてきたが、それに加えて今日からは「音声」での学習も始まるのだろう。

 

この現象を単純に「便利だ」と喜んでいいものか。

ディストピアがSFの話ではなく、現実味を帯びてきたとしか思えないのだが。

 

 

Illustrated by 希鳳

 

Pocket