生成AIの活用(その2)

エンジニア(職業的)な話

自然言語処理の分野においての最大の衝撃は、2020年に登場したOpenAI社のGPT-3です。
それまでのGPT-2に加えて、大きな進歩がありました。
与えられた指示に対して文章を創り出すだけでなく、プログラミング言語で回答することができるようになりました。

どういうことを意味するかと言いますと、情報社会の進展の立役者だった人間のプログラマーという職業はこの生成AIによって近い将来、代行されていくだろうということです。
つまり、人工知能が新たな人工知能をつくるためのプログラミングを行うことができるようになれば、その職業は人工知能を有するロボットが代行し、人間はもっと人間らしい職業に転職していくものと思います。普通に考えれば、人工知能が稼いでくれる富の分配があれば、経済的には豊かな生活が送れるはずですので、あまり悲観的に考えない方がいいかとは思います。政治の問題でもありますね。

生成AIの知能にあたる大規模言語モデル(LLM、Large Language Models)は、学習済みのデータを基に、質問内容(プロンプト)から統計的に確率が高い回答を生成します。したがって、常に完璧な回答をしてくれるわけではありません。

とは言っても、生成AIの特性を理解し上手に使いこなせば、相当なコスパタイパに繋がることは間違いありません。ChatGPTをまずは使ってみながら、どんなことができるのか探っていきたいと思います。現在(2025年2月8日時点)までのバージョンは以下です。
・2018~2019年:GPT、GPT-2が登場
・2020年:GPT-3が登場
・2022年11月:GPT-3.5が登場
・2023年3月:GPT-4が登場
・2024年5月:GPT-4oが登場

市営の小諸図書館で『エンジニアのためのChatGPT活用入門』(著者 大澤文孝)という本を見つけました。本に記されたGPTのバージョンは3.5だと思いますが、私が公式ページにアクセスしてダウンロードしたバージョンは4o(フォーオー)でした。早速、以下のような質問をし、上記の詳しい回答がChatGPTより得られました。


・~・~・~・~・~・~・~・~・~・
あなた:
ChatGPTの現在までのバージョンの履歴を教えて

ChatGPT:
ChatGPTのバージョンの主な履歴は以下のとおりです。

🔹 ChatGPTの主なバージョン履歴
📌 2022年

  • 2022年11月30日ChatGPT (GPT-3.5) 公開
    • OpenAIが無料のAIチャットボットとして公開。
    • GPT-3.5を基盤とし、自然な対話が可能に。

📌 2023

  • 2023年3月14日GPT-4 公開
    • GPT-3.5よりも性能が向上し、より高度な推論が可能に。
    • Proユーザー向けの**ChatGPT Plus(月額20ドル)**で利用可能。
  • 2023年5月ChatGPT Plugins, Code Interpreter (後のAdvanced Data Analysis), Web Browsingの導入
    • プラグイン機能が追加され、外部情報取得やコード実行が可能に。
    • Code Interpreter(後のAdvanced Data Analysis)は数値計算やデータ解析に対応。
    • Web Browsing(ブラウジング)機能も試験的に提供。
  • 2023年7月カスタム指示機能追加
    • ユーザーが事前に「どんなことを知っておいてほしいか」「どのように応答してほしいか」を設定可能に。
  • 2023年9月GPT-4 Turboの発表(Dev Day)
    • GPT-4より高速で安価な「GPT-4 Turbo」登場。
    • DALL·E 3(画像生成AI)が組み込まれる。
    • **音声会話機能(Voice Mode)**が発表。

📌 2024

  • 2024年1月メモリ機能の試験運用開始
    • ChatGPTがユーザーとのやり取りを記憶し、個別対応が可能に。
  • 2024年4月新しい「ChatGPT」アプリの改善
    • アプリのインターフェースが改良され、使いやすさが向上。
  • 2024年5月13日GPT-4o(オムニ)発表
    • GPT-4 Turboよりさらに高速で高性能、低コスト
    • マルチモーダル対応(テキスト・画像・音声を同時に処理)。
    • 無料ユーザーもGPT-4oを利用可能に(制限あり)。

現在のChatGPTは、GPT-4oが最新バージョンです。
特に、速度・精度・コストのバランスが優れており、マルチモーダル対応が強化されています。

さらに詳しく知りたい場合は、特定の時期について教えてくれれば、詳しく説明できますよ! 😊
・~・~・~・~・~・~・~・~・~・

簡単な質問で詳しい回答が即座に得られるのには感激しました。しかもGPT-4oという最新バージョンでの返答です。
早速、このChatGPT活用入門書を参考に、いろいろ試してみたいと思います。
このブログでの会社をつくるというようなビジネスに活用していこうと考えている私にとっては、渡りに船となるだろうと期待しています。特に製品開発におけるソフトのプログラミングについては、ひな型づくりをこの生成AIを使って自前でできるところまでは突っ走ってみようと考えるようになりました。

ソフトウェア開発の場面では相当な威力を発揮するのではないかと推測できますが、生成された成果物の追加・修正となると知識不足の壁に突き当たるとは思います。そもそもプログラミング言語に精通しないでできることは限られてきます。

まだまだ道のりは長そうですが、更なるアプローチとして検索拡張生成(RAG、Retrieval Augmented Generation)のような仕組みが必要にもなってくると考えます。これはLLMに無い知識を補う方法です。

ここでGoogle先生によるAIの概要説明を以下に記します。

RAG(検索拡張生成)とは
★AI による概要(Google検索2025/02/03)
・~・~・~・~・~・~・~・~・
RAG(検索拡張生成)とは、自然言語処理(NLP)技術の一種で、外部の情報を検索して生成AIで回答を生成する仕組みです。

RAGの仕組みは次のとおりです。
1.ユーザーが質問を入力する
2.RAGのアプリケーションが、質問に関連する情報をデータベースから検索する
3.検索結果と質問をプロンプトとして、大規模言語モデル(LLM)に送信する
4.LLMがプロンプトを基に回答を生成する

RAGは、検索機能と生成AIの弱点を補い合う技術として注目されており、ビジネスでの活用が期待されています。
RAGのメリットとしては、次のようなものがあります。
・高精度な応答を生成できる
・幅広いデータソースから必要な情報を取得できる
・継続的に学習と改善を続ける能力がある
・非公開の情報も扱える
・~・~・~・~・~・~・~・~・

上記のRAGのアプリケーションによって、スタートアップ企業が所有する社内情報を有効活用しつつ、LLMにもアクセスできるということです。

さあ、これから本格的に生成AIの世界に突入していきます。
このブログでは、エンジニア(職業的な)アイデンティティとして投稿していきますのでよろしくお願いいたします。

コメント

タイトルとURLをコピーしました