Claudeの悪意ある使用の検出と対策

Detecting and Countering Malicious Uses of Claude | Anthropic

Detecting and Countering Malicious Uses of Claude

現在、悪意のある行為者がClaudeを利用して影響力のあるキャンペーンや詐欺行為を行っており、特に「影響力を提供するサービス」では、Claudeがソーシャルメディアのボットアカウントの行動を決定するために使用されています。

具体的な事例としては、100以上のボットアカウントを管理し、政治的なナラティブを広める活動や、IoTセキュリティカメラのパスワードを収集しようとした行為者がClaudeを利用したケースがあります。

また、東欧の求職者を狙った採用詐欺キャンペーンでは、Claudeを用いてコミュニケーションを洗練させる手法が見られました。さらに、限られた技術力の持ち主がClaudeを利用してマルウェアを開発する事例も報告されています。

これらの事例から、行為者がAIを使って複雑な悪用システムを自動化し、技術的能力を向上させる傾向が明らかになりました。Anthropicは、これらの悪用事例を通じて得た知見をもとに、検出方法を改善し続けることを約束しています。

2025年4月23日に発表された報告書では、Anthropicが自社のAIモデル「Claude」の悪用を防ぐための取り組みと、悪意のある使用事例について詳述しています。この報告書は、AIの安全性を高めるための業界全体の取り組みを促進することを目的としています。

New report: How we detect and counter malicious uses of Claude.

For example, we found Claude was used for a sophisticated political spambot campaign, running 100+ fake social media accounts across multiple platforms.
— Anthropic (@AnthropicAI) April 23, 2025

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31