GPT-4

推論によるスケーリング(OpenAI o1のChain of Thought) AIの話題

推論によるスケーリング(OpenAI o1のChain of Thought)

OpenAIが発表した新しい人工知能「o1(オーワン)」は、「Chain of Thought」という推論の仕組みを使って複雑な問題を解決します。問題を小さな部分に分けて段階的に解決することで、より正確な答えを導き出すことができます。モデルサイズではなく推論時間を延長することで性能を向上させるアプローチの登場で、生成AIの世界は大きく変化する可能性があります。従来の生成AIとは違う「推論」の仕組み2024年9月12日、OpenAIは新しい人工知能「o1(オーワン)」を発表しま...
「ドリフト現象」とは?(漂流するAI) AIの話題

「ドリフト現象」とは?(漂流するAI)

AI(人工知能)は、学習量が多くなればどんどん賢くなると思われています。しかし、実際には学習するほど「おかしな回答」をする「ドリフト現象」があります。AIの仕組みはとても複雑です。そのため、AIの一部を良くしようとすると、別の部分の性能が下がってしまうことがあります。学習するほど賢くなる、という単純なものじゃないんだね。「ドリフト」って何?「ドリフト」とは、利用しているうちに AI の回答精度が下がってしまう現象です。例えば、こんな感じです:以前はきちんと答えられていた質問に...
GrokはXの中で使える対話型AI(Xプレミアム) AIの話題

GrokはXの中で使える対話型AI(Xプレミアム)

「Grok」は、Xに新たに追加された対話型AIで、Xにある多様な情報を要約して回答することができます。Grokの特徴は、Xのリアルタイム情報から素早く調査して結果を提示できること。現在、Grokは「Xプレミアム」以上の有料会員のみが利用可能です。「Grok」は、Xの膨大な情報を収集するときの「水先案内人(pilot)」のような役割が期待できます。YouTube動画でも話しています。フォローや検索・タグとは違った、対話型の情報収集が主流になっていくのかな。Xに「/」が追加された...
Claude 3 Opusに出戻った AIの話題

Claude 3 Opusに出戻った

先日、GPT-4 Turboの公開があり、Claude Proの更新をキャンセルしました。結局、Claude 3 Opusの方が「感覚的に好み」だったので、Claude Proのサブスクリプションを再開しました。GPT-4の方が「AIらしい文章」で その良さもあるのですが、要約タスクなどは やはり Claude 3の文章の方がスッと読める気がします。AIの性能は、スペックやスコアだけではわからない感じがします。人やタスクによっても相性もありますし。1か月だけならどちらも$20...
ChatGPTがS式を解釈する?(自然言語処理と構文解析) AIの話題

ChatGPTがS式を解釈する?(自然言語処理と構文解析)

「S式風のプロンプトの書き方が使えるかも?」という説を目にして、実験してみました。結果は、全く異なる構造のプロンプトを与えても、ほとんど同じ結果になってしまいました(GPT-4, Claude 3 Opus)。カッコをほとんど省いて「うまいこと」解釈しているようで、現状は修飾関係を明示するような用途では使えなさそうでした。生成AIは、もっともらしく動作します。だからこそ、うまくいくケースだけを与えて判断して、評価するのは危険ですね。エラーチェックや境界条件を調査することが、プ...
GPT 4-Turboが使えるようになったので(サブスクリプションの再開) AIの話題

GPT 4-Turboが使えるようになったので(サブスクリプションの再開)

Chat GPTの言語モデルがGPT 4-Turboにアップグレードしました。そこで、使い比べるために Claude Proをいったん停止して、ChatGPT Plusを再開してみました。GPT 4-Turboでは、主に処理速度やコスパが向上しています。ふーん。GPT 4-Turboで回答精度が上がったわけではないのかぁ。本当に「ターボ」ということなんだね。GPT 4 から Claude 3 Opusに移行したときほど、GPT 4-Turbo には驚きはありませんでした。個人...
Claudeという生成AI(調べものの回答では本当っぽい捏造を含むので注意) AIの話題

Claudeという生成AI(調べものの回答では本当っぽい捏造を含むので注意)

Claudeは、ChatGPTよりも「流暢な日本語」を生成するAIで、クリエイティブな作業や長文の生成に向いています。長い複雑な文章を与えても、かなり精度よく要約や回答させることができます。しかし、前提なしに調べものの回答をさせると、いかにも本物っぽい事例が架空のものだったりするので、受け売りは要注意です。Claude 3が話題なので気になる、という話。調べものに使うと足元をすくわれそうですが、要約はとても自然でわかりやすいです。自然言語処理にはいろんな用途があるので、得意・...
ChatGPTとオープンソースのLlama 2の「格差」(生成AIの学習データ) AIの話題

ChatGPTとオープンソースのLlama 2の「格差」(生成AIの学習データ)

オープンソースのLlama 2と商用モデルのChatGPT の違いに、学習データの質と範囲にあります。この学習データの質・量が、特に専門分野での生成AIの回答精度に影響してくるようです。腎臓学の多肢選択式テストで性能を比較した研究によると、Llama 2 に比べて ChatGPTがかなりよい成績を示しました。これは、GPT-4が、非公開の専門的で高品質なデータにアクセスできるのに対し、オープンソースのモデルは公開データに依存しているからだと考えられます。高度なAI開発では、ア...