「DeepSeek」とは？（AIサービスと言語モデル）

DeepSeekは、低価格なのに最新のChatGPTにも匹敵する性能を持つ、中国発のAIモデルです。
中国国内にデータを保存するDeepSeekアプリには、データプライバシーのリスクが存在する一方、言語モデルは既存サービスに組み込まれて始めています。
DeepSeekのAIサービスと言語モデルは、区別して考える必要があります。

YouTube動画でも話しています

1. DeepSeekはゲームチェンジャー？

DeepSeekは、「低コストなのにChatGPTと同等の高性能を実現したAI」です。
6710億という膨大な量のパラメータを扱いながら、従来のAIと比べてコストを抑えながら、高い性能を発揮できます。
特にDeepSeek-R1モデルは数学的な計算や論理的推論が得意で、場合によってはOpenAIのOpenAIの最新AI「ChatGPT o1」を上回る性能を示すと報告されています。

DeepSeekは、まずDeepSeek社のクラウド上のAIサービスとして提供されています。

開発者は、APIを通じて自分のアプリケーションにDeepSeekの機能を組み込めます。
高性能でありながら利用料金は他のAIサービスと比べて格段に安価です。

DeepSeek V3は、GPT-4と比較して約1/10から1/100の価格で利用可能

APIを使うイメージは、アプリやウェブサイトを作る開発ソフトに組み込むのがわかりやすいです。
作っているコードをAI処理を通して変換できるようになります。

AIの開発コストを大きく下げる可能性を示した、重要な技術的ブレークスルーと言えます。

目次に戻る

1-1. スタートアップとしてのDeepSeek

DeepSeekの特筆すべき点は、8億6000万円というAI開発にしては非常に低予算にもかかわらず、OpenAIの最新AIと同レベルの性能を持っている点です。

DeepSeek社は2023年、中国の杭州市で誕生した新興のAI企業です。
創業者の趙永剛（Zhao Yonggang）氏は、動画共有アプリTikTokで知られるByteDanceでAI研究者として活躍した人物です。
北京大学や清華大学という中国の名門大学を卒業した若手研究者たちが、開発チームの中核を担っています。

OpenAIは具体的な開発コストは公開していませんが、ChatGPTの運用コストだけで1日に約9,000万円（70万ドル）以上かかっている可能性があると報告されていて、開発コストはさらに膨大であったと考えられます。

目次に戻る

1-2. 効率化のためのいろんな工夫

DeepSeekの革新性は、少ないメモリ使用量で精度の高い予測を高速に計算できることです。
全体としては、「学習」より「推論」にエネルギーを投下しています。

AIを効率化する工夫

MoE (Mixture-of-Experts）：「専門家の混合」
MTP (Multi-Token Prediction): 「複数トークン予測」
MLA (Multi-head Latent Attention): 「多頭潜在注意機構」
FP8 (8-bit Floating Point): 「8ビット浮動小数点」

「MoE」は複数の専門AIモデル（エキスパート）を組み合わせて使う技術です。
各エキスパートが得意分野を担当し、タスクに応じて最適なエキスパートを選んで処理します。
この方式により、計算効率を高めながら高い性能を実現できます。
AIが文章を生成する際、通常は1つずつ単語（トークン）を予測しますが、MTPは一度に複数の単語を予測します。
この技術により、処理速度が最大1.8倍に向上します。
MLAはAIが文章を理解する際に使う技術です。
必要な情報に「注意を向ける」仕組み（Attention）を改良し、少ないメモリ使用量で効率的に情報を処理できます。
AIの計算で使用する数値の精度を8ビットに抑えることで、メモリ使用量を削減し計算速度を向上させます。
必要な部分だけ高精度な計算を行うことで、性能を維持しながら効率化を実現します。

企業は以前より高性能のAIをコストを抑えながら導入できるようになります

目次に戻る

1-3. GPU需要への影響（NVIDIAの株価）

DeepSeekは、「高価なNVIDIAのH100ではなく、より安価なH800を効率的に使う新しい学習方法を開発した」とされています。
この成果は、アメリカ企業が独占していたAI開発の常識を覆しました。

DeepSeekの経済的な衝撃

学習に特化した高価なGPUの需要が落ち着く？
（NVIDIA）
AI開発の参入障壁が下がる？
（Microsoft, Google, Meta, X）

DeepSeekは従来の10分の1のコストでAIモデルを開発できることを示しました。
すると、高価なGPUを大量に購入するという従来のやり方は見直しを迫られることになります。

短期的に最も顕著な影響は、NVIDIAの株価の下落でした。
DeepSeekの発表により1日で17%下落しました。
NVIDIAが独占的な地位を築いていたAI向けGPU市場に、より安価な代替製品が台頭する可能性が出てきたためです。

ざっくり言うと、学習に特化したGPUから推論に特化したGPUに需要が移行する流れが、より鮮明になったことを意味しています。

加熱していた期待感が沈静化する材料になったようです。

他のハイテク企業にも波及し、ナスダック総合指数は3%以上下落しました。
AI開発の参入障壁を下がるため、ビックテック以外のより多くのスタートアップ企業がAI開発に参入して来ることが影響しているのかもしれません。

確かに、AIは GoogleやMeta、XやMicrosoftなどビックテックの存在感が大きいもんね。
これらの企業にとっては、脅威になるのかもね。

目次に戻る

2. 【リスク】中国政府への情報漏洩やプライバシー侵害

DeepSeekの急速な成長には、中国政府の強力な支援が背景にあります。
米国による半導体の輸出規制という制約の中、中国国内で入手可能な部品で最高性能を実現するため、独自の最適化技術を開発しました。

ただし、中国発のAIであるため、データの取り扱いに関する懸念があることには注意が必要です。

中国では国家情報法により、企業は中国政府の情報活動に協力する義務があり、DeepSeekも中国本土の法律に準拠すると規約に明記しているからです。

そのため、ユーザーがDeepSeekに入力データが中国のサーバーに保存され、政府による監視や利用の対象となる可能性があります。

このような中国政府への情報漏洩やプライバシー侵害への懸念から、アメリカの多くの企業や政府機関では、DeepSeekの使用を禁止するところも出ています¹。

政府に「筒抜け」って、なんとなく嫌な気がするね。

目次に戻る

2-1. AIは誰にとって「都合の良い」情報を出すのか？

DeepSeekは中国企業が開発したAIモデルであることは、中国政府の利益に沿った情報を優先的に提供するように調整されていることを意味します。

AIが生成する情報を「調整」すること自体は、これまでも一般的なことです。
例えば、犯罪や倫理的に問題のある生成はブロックされていました。

ただし、AIの回答する結果に、中国政府の見解や価値観が紛れ込んで来ることで、利用者の「常識」が変容・侵食されていくことのリスクも考える必要があります。

これは、SNSでの「情報の偏り」の問題と似ています。
大量の情報から見せるものを選別する「アルゴリズム」は、いわば「水道の水質管理」のようなものです。

米国でTikTokが槍玉に上がったのと同じ話かぁ。

「憲法AI」とは？（AIフィードバックからの強化学習）

「憲法AI」は、与えられた原則を元にAIの自己改善によって倫理的な判断の精度を上げる手法です。うまくすれば人間の仕事は、AIの判断基準となるルール規範（「憲法」）を明文化するだけで済むわけです。

生成AIはデータとコードが一体化しているようなものでは？（コードを注入されるリスク）

生成AIシステムは一般的なプログラム以上に深刻な脆弱性を抱えているように思えます。それは悪意のあるユーザーによって、システムの動作を不正に操られる可能性。AIの動作を決める学習データが容易にインプットできるためです。最近、『情報セキュリティの敗北史: 脆弱性はどこから来たのか』という本を読んでいます。コンピュータの歴史を振り返ると、生成AIの「安全機構」の弱さが心配になりました。そもそも自然言語って、入力チェックが可能なのかな？原理的に。ノイマン型コンピュータの脆弱性プログラ...

目次に戻る

3. 組み込まれ始めるDeepSeek

一方で、Microsoftは、中国発のAI技術「DeepSeek」を自社のクラウドサービスに組み込み始めています。

例えば、クラウドプラットフォーム「Azure AI Foundry」のモデルカタログに「DeepSeek-R1」が追加されました²。
また、プログラマー向けの開発環境「Visual Studio Code」でも、DeepSeekの技術が使えるようになりました。

MicrosoftはDeepSeekを導入するにあたって、専門チームによる安全性の検証や、不適切なコンテンツを自動的にフィルタリングする仕組みを整えるなど「セキュリティ面での対策も万全を期している」としてます。

目次に戻る

3-1. 言語モデルとして「DeepSeek」

ここで区別が必要なのは、
「DeepSeekは DeepSeek社のAIサービスだけではない」ことです。

2025年1月20日、DeepSeek社は「DeepSeek-R1-Zero」と「DeepSeek-R1」という2つの言語モデルを、自由に使えるMITライセンスで公開しました。
ユーザーは、GitHubやHugging Faceというプラットフォームからこれらのモデルをダウンロードし、自分のパソコンで動かしたり、カスタマイズしたりできます。

（参考）