正しく活用するために、生成AIを理解する
生成AIというワードがメディアやSNSなどで盛んに見られるようになってだいぶ経ちます。OpenAI社がChatGPTを発表して以降、人間が実際に作業を行わなくても文章を作成してくれる、言葉から絵や写真、動画の生成などをするようなツールが次々を生み出され、SNSなどでも多く見るようになりました。仕事やプライベートでも利用している人もたくさんいると思います(次世代のiPhoneにも搭載されるみたいですし)。
そんな中、そもそも生成AIとは何なのか、今までAIと呼ばれていたものを何が違うのか、技術的な違いは何なのか、なぜ急に色々なことができるようになったのか、学習データは何なのか、アウトプットされたものの信頼性や権利はどうなっているのか、など私を含め専門的なことがよくわからない人は多いと思います。本書はそんな疑問を基礎的な部分から解説してくれる一冊です。
著者はAI研究で有名な東京大学松尾研究室に所属し、生成AIのコア技術である「強化学習」を専門に研究しています。研究者の立場で生成AIの今、未来が語られています。
本書の目次構成は以下のようになっています。
第1章 「生成AI革命」という歴史の転換点 - 生成AIは人類の脅威か?救世主か?
第2章 生成AIの背後にある技術 - 塗り替わるテクノロジーの現在地とは
第3章 AIによって消える仕事・残る仕事 - 生成AIを労働の味方にするには?
第4章 AIが問い直す「創作」の価値 - 生成AIは創作ツールか?創作者か?
第5章 生成AIとともに歩む人類の未来 - 「言語の獲得」以来の革新になるか?
この中から第2章と第4章の内容を紹介します。
第2章では生成AIを構成する技術的要素の解説があります。本章で解説されているのは、以下の技術です。
①今後も継続して使用されると思われる重要技術
②「知能」を生み出すために本質的であると思われる技術
③現時点では発展段階だが、将来的に確実に重要な役割を果たすと思われる技術
「探索と推論」から始まり「エキスパートシステム」としての利用、そこから「ディープラーニング」への発展という流れの部分は私自身もある程度、知識としては知っている内容でした。ディープラーニングで利用される多重ニューラルネットワークの学習データを人間が用意する教師あり学習を発展させた自己教師あり学習というところが新しいものでした。自己教師あり学習とは正解データを機械が準備するというものです。
ニューラルネットワークでは、ニューロン間のパラメータ(重み)があるのですが、パラメータが膨大で言語に特化したモデルが、ChatGPTのような大規模言語モデルと呼ぶそうです。言語モデルとは、「生成される単語・文章に確率を割り当てるモデル」であり、簡単にいうと「穴埋め問題」でどれが確率が高いかを予測して出力するというものです。(膨大な学習と人間によるチューニングを行うことで精度をあげている)
第4章は生成AIが文化・芸術、創作に与える影響について考察した章になります。本書では創造性の定義をマーガレット・ボーデンという研究者が提唱したものを引用しています。
①組み合わせ的創造性(Combinational Creativity)
②探索的創造性(Exploratory Creativity)
③革新的創造性(Transformational Creativity)①の「組み合わせ的創造性」は、既存のアイディアや知識の組み合わせ(あるいは引き算的な考え)によって、新しいものを生み出す創造性のことです。②の「探索的創造性」は、既存のアイディアや知識を何らかのルールや手続きに従って探索することで、新しいものを生み出す創造性です。③の「革新的創造性」は、既存のアイディアや知識の枠を飛び越えて、新たなルールを定義するような形で完全に新しいものを生み出す創造性を指しています。
上記定義を当てはめると生成AIは①②の創造性は持っているように思えます。③は生成AIでは実現は難しいように見えますが、人間でもなかなか発揮するのは難しいものになります。
創造性を発揮して何かを生み出すとき、単に物事を組み合わせるというだけでなく、個人的な感情や思想、個人の持つ「ストーリー」が映し出されます。私はこの、個人の感情や思想、ストーリーが反映された創造的講師こそが「創作」と呼ぶに値すると考えています。
著者はこのように述べています。つまり、AIそのものが創造性を持つのではなく、そこには人間からのインプットや人間によるアウトプットの補正が必要であるということです。現時点のAIは人間が創造性を発揮するためのツールとして利用することが現実的です。今後、この分野については研究が進んでいくことで更なる発展が見込まれると思います。
編集後記
個人的には第2章を読んで少し安心しました。ChatGPTをはじめとする生成AIは突然生まれたのではなく、今までの技術の延長線で実現していることがわかったので。とはいえ、大規模言語モデルを使用した文書生成、拡張モデルを利用した画像・動画・音声などの生成があり、これから様々な分野へ活用されていくのは間違いないと思いました。画像のリアルタイム合成とかできるようになると(最近あまり聞かない)メタバースへの融合やVRというよりAR(拡張現実)の分野にも発展していくのかと思います。
生成AIには膨大なエネルギーが必要になってくるので、それをどのように賄うのか、信頼性をどのように担保していくのか、悪用されないような規制をどうするのか、という課題は山積みです。新しいものにはリスクはつきものなので、一律規制をするのは良くないとは思いますが、適度なルールの中で最大限活用できるようになることを望みます。
また、生成AIが一般的に利用されることで考えることを放棄しやすい環境ができてしまうリスクもあると感じました。生成AIが出力するものは一見それっぽいので、トンデモ文書でも信じてしまう人が多くいるでしょう。出力されたもの(文書・画像・動画等)が正しいかどうかを疑うという意識を常に持っていないと簡単にハルシネーション(幻覚)に引っかかってしまいます。
出力されたものが文章であればおかしいことに気づきやすいですが、画像や動画などはダイレクトに視覚情報として入ってくるため、そのまま信じてしまうことが多いと思います。何が正しくて何が正しくないのか、これを判断する力がとても重要になってくるのだと思いました。生成AIが出る前から当たり前に使われていた検索エンジンでも、検索アルゴリズムによって偏った情報出ていた可能性がありましたが、それでもそれはアルゴリズムが生み出したものではありません。生成AIは実際のものを生み出して人々に見せているため、それによる情報操作が行われる可能性があります。なので、使う側にもリテラシーが必要になってきます。プロンプトエンジニアリングという言葉があります。個人的には「これはエンジニアリングなのか?」という疑問がありますが、何かを生み出すために必要なもの、という定義であればエンジニアリングなんだろうと思います。
自分がこれから生成AIとどのように付き合っていくのか、生成AIが作ったものの真贋を見分けるためにどのような点で気をつければいいのか?そのような内容を考えるきっかけを本書は与えてくれたと思います。
生成AIの技術やトレンドは日々変わってきています。様々なソフトウェアにもあっという間に組み込まれています。ビジネスパーソンとしては、トレンドに踊らされずに生産性を上げるツールとして生成AIとうまく付き合うことが大事なのかなと思う今日この頃です。
コメント