- Claudeは、ChatGPTよりも「流暢な日本語」を生成するAIで、クリエイティブな作業や長文の生成に向いています。
- 長い複雑な文章を与えても、かなり精度よく要約や回答させることができます。
- しかし、前提なしに調べものの回答をさせると、いかにも本物っぽい事例が架空のものだったりするので、受け売りは要注意です。
Claude 3が話題なので気になる、という話。
調べものに使うと足元をすくわれそうですが、要約はとても自然でわかりやすいです。
自然言語処理にはいろんな用途があるので、得意・不得意があるんでしょうね。
1. 基本的な使い方はChatGPTなどとほぼ同じ
Claudeには、無料プランもあるので、アカウントを作るだけで使用できます。
入力欄に指示(プロンプト)を入れて、送信していくだけ。
使い方は、ChatGPTなどと同じです。
1-1. Claudeの利用登録はかんたん
すぐに使いたいなら、Googleアカウントとの連携が速いです。
Googleアカウントとの連携したくなければ、メールアドレス・パスワードを登録してもいいんだね。
新規登録にはスマートフォンの電話番号による「SMS認証」がありました。
あとは、使用上の注意について同意したら、利用できます。
デフォルトのフォントがセリフ体だったり、背景が書籍用紙風だったりして、なんとなく「リッチな」感じがするね。
1-2. Claude Proは月20ドル
ただし、評判の “Claude 3 Opus”(文脈理解量が大きい上位モデル)は、有料プランです。
月20ドルのサブスクリプションなので、ChatGPTと同じですね。
2. ClaudeとAnthropic
「Claude」は、AnthropicというAI企業が開発した大規模言語モデルです。
特に Claude 3が公開され、日本語での文章生成能力(自然な会話、幅広い知識、創造性)に長けている、と評価されています。
- 理解できる文脈の長さが飛躍的に伸びたこと、
- 厳密であるより創造的であることを重視していること、
- 多彩な日本語表現を選択すること、
- 長い文章も比較的 高速に生成できること、
が高い評価の要因になっているようです。
モデル | コンテクストウィンドウ |
---|---|
Claude 3 Opus | 20万トークン以上 |
Chat GPT GPT4 | 8192トークン |
ChatGPT 3の登場時にも思ったのですが、生成AIの文脈理解の「量」が一定の「閾値」を超えたときに、急に「質」的に「賢くなった」ように感じるような気がします。
Anthropic社は、生成AIの分野で注目されている米国のスタートアップ企業です。
元々OpenAIに所属していた複数のメンバーが、そのやり方に異を唱えて2021年に設立したのがAnthropicです。
GoogleはAnthropicに4億ドル近くを投資し、正式な提携を結んでいます。
2-1. ただし、捏造も上手い……
もちろん、「完全にGPT-4を上回っているとも言えない」という評価もあります。
生成結果の根拠を聞いてみると、「でっち上げ」だと白状することが多いです。
どうも「具体例を挙げて説明して」というのが、「説明のための具体例を作って」と解釈して回答することがあるのです。
かなり詳細に書かれているので、実在の事例に見えるのが厄介。
実際にGPT 4とClaude 3の生成結果の比較については、以下を見るとわかりやすいです。
これは「厳密さ」と「創造性」のチューニング次第な気もします(temperatureパラメータ)。
ただ、ChatGPT以上に使いどころを選ばないといけないな、と感じました。
2-2. ハルシネーションの例(link)
たとえば、Claude 3 OpusとChatGPT GPT4に以下の質問をしてみました。
「linkを使用してワンクリック決済の情報を保存する」とはどういうことですか?
決済サービスlinkについて教えて。
Claude 3 Opus | ChatGPT 4 |
---|---|
「link」は、GMOペイメントゲートウェイ株式会社が提供するオンライン決済サービスの名称です。主に以下のような特徴があります。… | Linkは、Stripeによって開発された決済サービスで、ユーザーがオンラインでの支払い情報を安全に保存し、それを再利用することができるようにすることで、支払いプロセスを速める機能です。… |
このときに私が知りたかったのは、「Link by Stripe」でした。
ChatGPTは正しいものの、Claude 3 Opusは的外れの回答になっていました。
また、GMOが実際に提供しているのは、「リンクタイプ Plus」というサービス名です。
2-3. 回答が毎回違う
さらに、Claudeでは回答を再生成すると全然違う答えを返してきました。
今度は、NTTドコモのサービスと言っています。
Claudeは文章を与えて、それについて要約させたりは得意ですが、前提なしに質問するのはやめておいた方がよさそうです。
これでは「ガチャ」みたいだね。
架空の物語のアイデアを作るのなら問題ないけど、調べものでは困るね。
あと、これはClaudeに限りませんが、生成AIにとって「事実」と「物語」に違いはあるのか、も疑問になりました。
人間にとってはこれが重大ですが、文字だけ(画像などもありますが)を処理する生成AIにとってはどうなのでしょう。
3. ハルシネーションの対策
ハルシネーションが多いと安心して利用できません。
ハルシネーションを最小限に抑えるには、コツがあります。
一番有効なのは、プロンプトで「わからない」と言うことを許可することです。
これだけで間違った情報が大幅に減ります。
また、「回答生成後に各主張を裏付ける引用を探し、見つからない場合はその主張を撤回する」よう指示するのも有効です。
次に、特に長い文書を扱うときに、「最初に原文から引用を抽出してもらってから、タスクを実行する」よう指示すると、回答が実際のテキストに「引きずられる」ので、ハルシネーションが減ります。
そのほか、最終的な回答を出す前に推論過程を段階的に説明させる(思考プロセスの検証)方法や、同じプロンプトを何度も実行し出力を比較する方法などがあります。
4. システムプロンプトの違い
2つのAIの違いを調べていると、興味深い話がありました。
Claude 3とChatGPTとで、システムプロンプトの考え方が異なっているようなのです10。
- You are ChatGPT, a large language model trained by Open AI, based on the GPT-4 architecture.10
- The assistant is Claude, created by Anthropic.11
ChatGPTの対話機能は、いわば「人格」のように「You」で書かれています。
一方、Claudeの方は、「The assistant」と三人称で規定されています。
システムプロンプトの違いは、どれぐらい生成結果に影響するのかな?
内部パラメータの調整や倫理的な制約などの影響もありそうだし。
(補足)
- 元木大介@生成AIとCursorConnectさん: 「生成AIは人間よりレスポンス圧倒的に速いので、 / X
- Hiromitsu Takagiさん / X
- 高木浩光@自宅の日記 – Claude 3に例の「読了目安2時間」記事を解説させてみた
- 元木大介@生成AIとCursorConnectさん: 「うそやろ、 / X–
- ChatGPTplusを解約してClaude3Proへ乗り換えをする際に検討した事|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請
- mutaguchiさん: 「Claude 3 Opusは、8割のケースでGPT-4より圧倒的に優れていると感じるが / X
- 24/03/20 ChatGPTとClaude3の比較
- ASCII.jp:ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (5/5)
- Reduce hallucinations – Anthropic
- sangmin.eth @ChoimiraiSchoolさん: 「昨日、AI Front-End開発の参加者から聞いた話だけど、 / X
- Amanda Askellさん: 「Here is Claude 3’s system prompt! 」 / X