
OpenAI GPT-4
OpenAIから「GPT-4」が登場しました。テキストや画像を質問や要求として入力するとその内容を読み取って回答を作成してくれる機械学習モデルです。まだ現実世界でのさまざまな場面では人間より劣った能力しか発揮できませんが、学術・専門分野では人間と同等の能力を発揮できる場合もあると案内されています。GPT-4のテキスト入力機能は目下、ChatGPTの有料版「ChatGPT Plus」と招待制のAPIで利用できます。画像入力機能については2023年3月15日時点では準備中。このほかモデルの性能を自動評価するフレームワーク「OpenAI Evals」がオープンソース化され、誰でもモデルの欠点を報告できるようになりました。
司法試験の模擬試験では上位10%の成績で合格
これまで「ChatGPT」などが採用してきたGPT-3.5の後継版。GPT-3.5に司法試験の模擬試験を受けさせると、下位10%程度の成績になってしまいますが、GPT-4は上位10%程度の成績で合格できます。またGPT-4.0はGPT-3.5に比べ日本語を含む24の言語をよりうまく処理できるようになっています。OpenAIの社内でもすでにGPT-4を使っていてサポート、営業、コンテンツモデレーション、プログラミングなどの分野で大きな効果を上げているとのこと。
テキストだけでなく画像も読み取れる
GPT-4は、テキストだけでなく画像を入力できる機能があります。テキストと画像が混在するような情報を読み取って、テキストで回答をしてくれます。写真や図、スクリーンショットを含む文書など、さまざまな領域で、テキストのみの入力と同様の能力を発揮できます。ただし画像入力はまだ一般公開はされていません。OpenAIでは次のように掲示板「Rddit」のジョーク画像をGPT-4に読み取らせた例が紹介されています。

質問
この画像はどこが面白いのでしょうか?パネルごとに描写してください。
回答
画像は「Lightning Cable」アダプターのパッケージで、3つのパネルがあります。
パネル1:VGAコネクター(一般的にコンピュータのモニターに使われる青くて大きな15ピンコネクター)を充電ポートに接続したスマートフォンです。
パネル2:VGAコネクターの絵が描かれた「Lightning Cable」アダプターのパッケージ。
パネル3:VGAコネクタのクローズアップで、先端に小さなLightningコネクター(iPhoneなどのApple製品の充電に使う)が付いている。
この画像に含まれる諧謔は、大きく時代遅れのVGAコネクターを小さく現代的なスマートフォン充電ポートに差し込むというくだらなさから来ています。