（画像の出典はすべてOpenAI公式サイト）

OpenAI GPT-4

OpenAIから「GPT-4」が登場しました。テキストや画像を質問や要求として入力するとその内容を読み取って回答を作成してくれる機械学習モデルです。まだ現実世界でのさまざまな場面では人間より劣った能力しか発揮できませんが、学術・専門分野では人間と同等の能力を発揮できる場合もあると案内されています。

GPT-4のテキスト入力機能は目下、ChatGPTの有料版「ChatGPT Plus」と招待制のAPIで利用できます。画像入力機能については2023年3月15日時点では準備中。このほかモデルの性能を自動評価するフレームワーク「OpenAI Evals」がオープンソース化され、誰でもモデルの欠点を報告できるようになりました。

司法試験の模擬試験では上位10％の成績で合格

これまで「ChatGPT」などが採用してきたGPT-3.5の後継版。GPT-3.5に司法試験の模擬試験を受けさせると、下位10％程度の成績になってしまいますが、GPT-4は上位10％程度の成績で合格できます。またGPT-4.0はGPT-3.5に比べ日本語を含む24の言語をよりうまく処理できるようになっています。

OpenAIの社内でもすでにGPT-4を使っていてサポート、営業、コンテンツモデレーション、プログラミングなどの分野で大きな効果を上げているとのこと。

テキストだけでなく画像も読み取れる

GPT-4は、テキストだけでなく画像を入力できる機能があります。テキストと画像が混在するような情報を読み取って、テキストで回答をしてくれます。写真や図、スクリーンショットを含む文書など、さまざまな領域で、テキストのみの入力と同様の能力を発揮できます。ただし画像入力はまだ一般公開はされていません。

OpenAIでは次のように掲示板「Rddit」のジョーク画像をGPT-4に読み取らせた例が紹介されています。

GPT-4にテキストと画像を読み取らせた例

質問
この画像はどこが面白いのでしょうか？パネルごとに描写してください。

回答
画像は「Lightning Cable」アダプターのパッケージで、3つのパネルがあります。

パネル1：VGAコネクター（一般的にコンピュータのモニターに使われる青くて大きな15ピンコネクター）を充電ポートに接続したスマートフォンです。
パネル2：VGAコネクターの絵が描かれた「Lightning Cable」アダプターのパッケージ。
パネル3：VGAコネクタのクローズアップで、先端に小さなLightningコネクター（iPhoneなどのApple製品の充電に使う）が付いている。

この画像に含まれる諧謔は、大きく時代遅れのVGAコネクターを小さく現代的なスマートフォン充電ポートに差し込むというくだらなさから来ています。

性格・個性を設定できる

またGPT-4の「システムメッセージ」部分に設定を書いておくことで、GPT-4の性格や個性を決められます。例えば「ソクラテスのように生徒に自分の頭で考えさせる家庭教師として回答する」としておけば、使う人が数学の問題などについて質問をしても、すぐに回答を出すのではなく、正解を自分で考えるようにヒントを出しながら導いてくれます。

やっぱりミスをする

GPT-4はGPT-3.5に比べ改善したといってもやはり間違いを犯す、とOpenAIは注意を呼び掛けています。事実と異なる幻のような認識をしたり、おかしな推論をしたりします。その限界を理解したうえで場合によってはほかの手段で内容の検証をしながら利用するよう促されています。なおGPT-4は2021年9月以降の事実についてほとんど情報を持っておらず経験から学習することもない、と案内されています。一方で専門家の協力を得て、例えば危険な化学物質の合成方法に関する要求を拒否するなど悪用されない工夫はされています。

APIの利用料金

招待制API「gpt-4」の利用料金は質問（プロンプト）トークン1kあたり0.03ドル、回答（コンプリーション）トークン1kあたり0.06ドルです。標準のレート制限は1分間に40kトークン、1分間に200リクエストです。gpt-4のコンテキストの長さは8,192トークン。さらに3万2,768コンテキスト（約50ページのテキスト）のバージョンである「gpt-4-32k」も登場しています。価格はプロンプトトークン1kあたり0.06ドル、コンプリートトークン1kあたり0.12ドルです。API利用についてはウェイティングリストに登録するよう案内されています。