【スポンサーリンク】

Claudeという生成AI(調べものの回答では本当っぽい捏造を含むので注意)

Claudeという生成AI(調べものの回答では本当っぽい捏造を含むので注意)
  • Claudeは、ChatGPTよりも「流暢な日本語」を生成するAIで、クリエイティブな作業や長文の生成に向いています。
  • 長い複雑な文章を与えても、かなり精度よく要約や回答させることができます。
  • しかし、前提なしに調べものの回答をさせると、いかにも本物っぽい事例が架空のものだったりするので、受け売りは要注意です。
Claudeという生成AI(調べものの回答では本当っぽい捏造を含むので注意)

Claude 3が話題なので気になる、という話。

Claudeという生成AI(調べものの回答では本当っぽい捏造を含むので注意)

調べものに使うと足元をすくわれそうですが、要約はとても自然でわかりやすいです。
自然言語処理にはいろんな用途があるので、得意・不得意があるんでしょうね。

\記事が役に立ったらシェアしてね/
【スポンサーリンク】

1. 基本的な使い方はChatGPTなどとほぼ同じ

Claudeには、無料プランもあるので、アカウントを作るだけで使用できます。
入力欄に指示(プロンプト)を入れて、送信していくだけ。

(参考)
  • Claude(https://claude.ai/chats)
基本的な使い方はChatGPTなどとほぼ同じ

使い方は、ChatGPTなどと同じです。

1-1. Claudeの利用登録はかんたん

すぐに使いたいなら、Googleアカウントとの連携が速いです。

Claudeの利用登録はかんたん
Claudeの利用登録はかんたん

Googleアカウントとの連携したくなければ、メールアドレス・パスワードを登録してもいいんだね。

新規登録にはスマートフォンの電話番号による「SMS認証」がありました。

Claudeの利用登録はかんたん

あとは、使用上の注意について同意したら、利用できます。

Claudeの利用登録はかんたん
Claudeの利用登録はかんたん

デフォルトのフォントがセリフ体だったり、背景が書籍用紙風だったりして、なんとなく「リッチな」感じがするね。

1-2. Claude Proは月20ドル

ただし、評判の “Claude 3 Opus”(文脈理解量が大きい上位モデル)は、有料プランです。

Claude Proは月20ドル

月20ドルのサブスクリプションなので、ChatGPTと同じですね。

2. ClaudeとAnthropic

Claude」は、AnthropicというAI企業が開発した大規模言語モデルです。
特に Claude 3が公開され、日本語での文章生成能力(自然な会話、幅広い知識、創造性)に長けている、と評価されています。

  • 理解できる文脈の長さが飛躍的に伸びたこと、
  • 厳密であるより創造的であることを重視していること、
  • 多彩な日本語表現を選択すること、
  • 長い文章も比較的 高速に生成できること、

が高い評価の要因になっているようです。

モデルコンテクストウィンドウ
Claude 3 Opus20万トークン以上
Chat GPT GPT48192トークン
両モデルの文脈を理解する能力の違い
ClaudeとAnthropic

ChatGPT 3の登場時にも思ったのですが、生成AIの文脈理解の「量」が一定の「閾値」を超えたときに、急に「質」的に「賢くなった」ように感じるような気がします。

インターネット上の評価例
  • GPT-4まではツール感が否めなかった。Claudeは同僚と仕事している感ある1
  • Claude 3、マジヤバい。ヤバいよヤバいよ2
  • Anthropicの先日出たばかりのClaude 3(Opus)が、ChatGPTのGPT-4を超えてきたと聞いて、自分の原稿を解説させてみたところ、確かに革新的な進歩が見られる。もはや内容を「理解」しているようにしか見えない3
  • うそやろ、こんなにClaudeすごいのにまだChatGPTで止まってる人いるんか4
  • Claude 3 Opusの文章のクオリティの高さに魅了され、ChatGPTからの乗り換えを決意しました5
  • 自然さというか「中に人が入ってる感じ」は10割、Claude3が勝ってる。これはチューニングに起因すると思ってる6
AnthropicとOpenAI

Anthropic社は、生成AIの分野で注目されている米国のスタートアップ企業です。

元々OpenAIに所属していた複数のメンバーが、そのやり方に異を唱えて2021年に設立したのがAnthropicです。
GoogleはAnthropicに4億ドル近くを投資し、正式な提携を結んでいます。

2-1. ただし、捏造も上手い……

もちろん、「完全にGPT-4を上回っているとも言えない」という評価もあります。

インターネット上の評価例
  • 軽く触った感じでは、OpusはなんJスレ書かせる以外では言うほどChatGPTより凄いって感じでもないかなと思った7
  • Claude 3 Opusは、8割のケースでGPT-4より圧倒的に優れていると感じるが、全然ダメなケースも2割くらいある、みたいな感じですね6
  • まるで本当のことのように嘘を付く「ハルシネーション(幻覚)」の多さだ。外部インターネットへのアクセスができないこともあり、特に上場していないような規模の日本の企業について聞くと、8割方でたらめな説明を始める8

生成結果の根拠を聞いてみると、「でっち上げ」だと白状することが多いです。

ただし、捏造も上手い……

どうも「具体例を挙げて説明して」というのが、「説明のための具体例を作って」と解釈して回答することがあるのです。
かなり詳細に書かれているので、実在の事例に見えるのが厄介。

実際にGPT 4とClaude 3の生成結果の比較については、以下を見るとわかりやすいです。

ただし、捏造も上手い……

これは「厳密さ」と「創造性」のチューニング次第な気もします(temperatureパラメータ)。

ただ、ChatGPT以上に使いどころを選ばないといけないな、と感じました。

2-2. ハルシネーションの例(link)

たとえば、Claude 3 OpusとChatGPT GPT4に以下の質問をしてみました。

「linkを使用してワンクリック決済の情報を保存する」とはどういうことですか?
決済サービスlinkについて教えて。

ハルシネーションの例(link)
Claude 3 OpusChatGPT 4
「link」は、GMOペイメントゲートウェイ株式会社が提供するオンライン決済サービスの名称です。主に以下のような特徴があります。…Linkは、Stripeによって開発された決済サービスで、ユーザーがオンラインでの支払い情報を安全に保存し、それを再利用することができるようにすることで、支払いプロセスを速める機能です。…

このときに私が知りたかったのは、「Link by Stripe」でした。
ChatGPTは正しいものの、Claude 3 Opusは的外れの回答になっていました。
また、GMOが実際に提供しているのは、「リンクタイプ Plus」というサービス名です。

2-3. 回答が毎回違う

さらに、Claudeでは回答を再生成すると全然違う答えを返してきました。
今度は、NTTドコモのサービスと言っています。

回答が毎回違う

Claudeは文章を与えて、それについて要約させたりは得意ですが、前提なしに質問するのはやめておいた方がよさそうです。

回答が毎回違う

これでは「ガチャ」みたいだね。
架空の物語のアイデアを作るのなら問題ないけど、調べものでは困るね。

回答が毎回違う

あと、これはClaudeに限りませんが、生成AIにとって「事実」と「物語」に違いはあるのか、も疑問になりました。
人間にとってはこれが重大ですが、文字だけ(画像などもありますが)を処理する生成AIにとってはどうなのでしょう。

3. ハルシネーションの対策

ハルシネーションが多いと安心して利用できません。
ハルシネーションを最小限に抑えるには、コツがあります。

ハルシネーションを減らすコツ9
  • 「わからない」と言うことを許可する
  • 引用元や出典を探すように指示する
  • 事実を確認するために直接引用を使う

一番有効なのは、プロンプトで「わからない」と言うことを許可することです。
これだけで間違った情報が大幅に減ります。

また、「回答生成後に各主張を裏付ける引用を探し、見つからない場合はその主張を撤回する」よう指示するのも有効です。

次に、特に長い文書を扱うときに、「最初に原文から引用を抽出してもらってから、タスクを実行する」よう指示すると、回答が実際のテキストに「引きずられる」ので、ハルシネーションが減ります。

そのほか、最終的な回答を出す前に推論過程を段階的に説明させる(思考プロセスの検証)方法や、同じプロンプトを何度も実行し出力を比較する方法などがあります。

4. システムプロンプトの違い

2つのAIの違いを調べていると、興味深い話がありました。
Claude 3とChatGPTとで、システムプロンプトの考え方が異なっているようなのです10

  • You are ChatGPT, a large language model trained by Open AI, based on the GPT-4 architecture.10
  • The assistant is Claude, created by Anthropic.11
システムプロンプトの違い

ChatGPTの対話機能は、いわば「人格」のように「You」で書かれています。
一方、Claudeの方は、「The assistant」と三人称で規定されています。

システムプロンプトの違い

システムプロンプトの違いは、どれぐらい生成結果に影響するのかな?
内部パラメータの調整や倫理的な制約などの影響もありそうだし。

こちらもどうぞ。
Claude 3 Opusに「振り飛車」を聞いてみた(事前学習が弱い分野の具体例)
Claude 3 Opusに「振り飛車」を聞いてみた(事前学習が弱い分野の具体例)
Claude 3 Opusは、自然な文章を生成するのが特徴です。しかし、事前学習だけによる回答には、「知ったかぶり」も含まれるので注意が必要です。 そのうち改善されると思いますが、どこまでいっても「信頼性」の問題はあります。 生成AIとの対話では、情報源ではなく情報加工に使う、ということを意識するとよいです。 まんべんなく賢いわけではないんだね。 自分が知らない分野の話だと、ころっと「だまされてしまう」かも。 環境:2024年4月時点、Claude 3 Opus Claude...

【人工知能】ChatGPTに質問してみたら、けっこう間違えもあった(アカウント登録の仕方)
【人工知能】ChatGPTに質問してみたら、けっこう間違えもあった(アカウント登録の仕方)
話題になっている ChatGPT(chat.openai.com/chat) のアカウントを作成して、試してみました。 まるで人間が答えたような回答を、すぐに出すのでびっくりしました。しかし、いろんな回答をよく読んでみると「滋賀を四国地方」と言ってみたり、あからさまな間違いも少なくありません。 また、こちらから送った文章に機密事項が含まれている場合でも、ChatGPTはそれを学習して、別の人に回答してしまう可能性があります。 いよいよ「検索の次の時代」が見えてきました。 ただ...

「Bardへようこそ」 Googleの生成AIの使い方
「Bardへようこそ」 Googleの生成AIの使い方
Google検索の下に「New! Bard を試そう。Google の試験運用中 AI サービス」というメッセージが表示されていました。 2023年3月21日の英語版の公開から約1ヶ月半、2023年5月11日から日本語でも利用できるようになりました。 Google(2023-05-18時点) (参考) Bard は、ジェネレーティブ AI を活用してユーザーをサポートする Google の試験運用中のサービスです。旅行プランの案を出したり、ブログ記事の構成案を作成したりと、英...

Transformerモデルと「自然言語」(GPTが「スマホの次」だった)
Transformerモデルと「自然言語」(GPTが「スマホの次」だった)
Transformerがもっと強力になったら、個々のアプリもいらなくなるかも。 たとえば、時間を聞いて、その場で時計盤の画像を生成して見せくれるなら、極端な話 時計も時計アプリもいらなくなっちゃう。 すでに、そういう次元じゃないかもしれないけど。 あとは、電気代の問題ですね。 Transformerモデルがすごいのは、「自己注意機構」でテキスト内の単語間関係を分析できるようになったこと。旧来のモデルと比べ、効率的に文脈全体を把握できるようになったのが成長の背景です。 翻訳や要...

(補足)

  1. 元木大介@生成AIとCursorConnectさん: 「生成AIは人間よりレスポンス圧倒的に速いので、 / X
  2. Hiromitsu Takagiさん / X
  3. 高木浩光@自宅の日記 – Claude 3に例の「読了目安2時間」記事を解説させてみた
  4. 元木大介@生成AIとCursorConnectさん: 「うそやろ、 / X
  5. ChatGPTplusを解約してClaude3Proへ乗り換えをする際に検討した事|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請
  6. mutaguchiさん: 「Claude 3 Opusは、8割のケースでGPT-4より圧倒的に優れていると感じるが / X
  7. 24/03/20 ChatGPTとClaude3の比較
  8. ASCII.jp:ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (5/5)
  9. Reduce hallucinations – Anthropic
  10. sangmin.eth @ChoimiraiSchoolさん: 「昨日、AI Front-End開発の参加者から聞いた話だけど、 / X
  11. Amanda Askellさん: 「Here is Claude 3’s system prompt! 」 / X
QRコードを読み込むと、関連記事を確認できます。

Claudeという生成AI(調べものの回答では本当っぽい捏造を含むので注意)
【スポンサーリンク】
タイトルとURLをコピーしました