強化学習

機械学習の基本的な仕組み（アメとムチ）

機械学習の基本的な仕組み（アメとムチ）

機械学習はコンピュータがデータから学ぶ方法で、特に強化学習は人間の学習過程に似ています。強化学習では「状態認知→判断→行動→評価→報酬→強化」という6ステップのサイクルを繰り返します。このプロセスでは、新しい行動を試す「探索」と効果が分かっている行動を選ぶ「活用」のバランスを取りながら、失敗と成功を通じて徐々に賢くなっていきます。学習サイクルの全体像「機械学習」は、コンピュータがデータから学んで賢くなる方法です。その中でも強化学習という手法は、人間が学ぶ過程にとても似ています...

2025.02.26 2025.03.07

AIの話題ミニ用語辞典

「いいね」が作る虚像（フィルターバブルとエコーチェンバー）

「いいね」が作る虚像（フィルターバブルとエコーチェンバー）

インターネットの情報は、アルゴリズムによって個人の好みに合わせて表示されています。この仕組みにより、同じ価値観を持つ人々が集まり、特定の意見が増幅される「エコーチェンバー現象」が起きています。暗黙的に選別するレコメンドエンジンの強化学習を理解して、必ず複数の多様な情報源で確認する意識が大切です。エコーチェンバー・フィルターバブル私たちは毎日、SNSやウェブサイトを通して大量の情報に触れています。しかし、すべての情報を見ることはできないため、機械的に選別されたものを見ています。...

2025.02.24 2025.02.26

SNSスマホ基礎ニュースから考えるパソコン基礎知識ミニ用語辞典

【注意】アルゴリズムの心のない「おすすめ」にご用心（TikTokが自殺願望を強めてしまった事件）

【注意】アルゴリズムの心のない「おすすめ」にご用心（TikTokが自殺願望を強めてしまった事件）

家庭内で子どもがTikTokなどのショート動画を見ている場合、ちょっと内容にも注意を払っておいてください。米国でTikTokが、16歳の少年に自殺を促すような動画を繰り返し表示し、実際に命を絶ってしまった事件がありました。しかも、少年は自らそういう動画を探していたわけではなく、不完全なアルゴリズムによって否定的感情を煽る動画が過剰に表示された可能性があるのです。子どものスマホの中という、ある意味「密室」でこのような情報が埋もれてしまうというのは、とても怖いことですね。TikT...

SNSスマホ基礎ニュースから考える

「憲法AI」とは？（AIフィードバックからの強化学習）

「憲法AI」とは？（AIフィードバックからの強化学習）

「憲法AI」は、与えられた原則を元にAIの自己改善によって倫理的な判断の精度を上げる手法です。うまくすれば人間の仕事は、AIの判断基準となるルール規範（「憲法」）を明文化するだけで済むわけです。

2024.03.23 2024.03.25

AIの話題とりあえずのメモセキュリティ

機械学習のAIは「人間のような感情」を持たない

機械学習のAIは「人間のような感情」を持たない

考えてみれば、生成AIは悲しい存在である。人は、生物だから「生きる本能」によって駆動している。だから、自己のために動いている。一方、「機械学習」によるAIは、「評価」によって駆動している。これは、他者によるものである。この違いは根本的で、だから AIには、「人間のような感情」は発生しないだろう。AIが「感情」のような「複雑な反応」を持つ可能性はありますが、人間とは根本的に異なるものになると思います。「生命」につながっていないからです。例えていえば、炭素以外の元素による「有機...

2024.02.11 2025.02.26

AIの話題ちいラボエッセイ