AIトレーニング用のデータをかき集めるクローラーを無限生成される迷路に閉じ込める「Nepenthes」が開発される – GIGAZINE

AIトレーニング用のデータをかき集めるクローラーを無限生成される迷路に閉じ込める「Nepenthes」が開発される
AIのトレーニングに使用されるデータをインターネット上からかき集めるために使用されるのがクローラーです。自身のウェブサイト上のデータをAIのトレーニングに利用されないようにするためのオプションを大手AI企業は提供していますが、この種のブロッ...続きを読む

AIのトレーニングに使用されるデータをインターネット上からかき集めるために使用されるのがクローラーです。自身のウェブサイト上のデータをAIのトレーニングに利用されないようにするためのオプションを大手AI企業は提供していますが、この種のブロックを迂回してクローラーがウェブサイトから情報を抜き出していることも問題視されています。そんなクローラーを無限に生成される迷路に閉じ込めることができるのが「Nepenthes」です。

Nepenthesは、数十のリンクを持つウェブページを無限に生成し、クローラーを捕獲します。生成されたリンクは常にNepenthes自身に戻るため、クローラーは有用なデータを収集できません。クローラーは迷路をさまよい続け、リソースを消費するだけで、実際には何の役にも立たない状態になります。

開発者のAaron B氏は、Nepenthesを「一種の芸術作品」と位置づけ、インターネットの現状に対する怒りを表現しています。彼は、クローラーの問題がインターネットユーザーの関心を引き付けたことからこのプロジェクトを思いついたと述べています。

Nepenthesは「有害なアクティビティを引き起こすことを意図した悪意のあるソフトウェア」として警告されています。使用する際は注意が必要です。

Nepenthesの公開以来、クローラーは何百万回もこのページにアクセスしているとのことです。開発者は、Googleなどの大手クローラーでさえこのトラップを回避できていないと主張しています。

このように、NepenthesはAIトレーニング用のデータ収集を阻止するための新しいアプローチとして注目されていますが、その使用には慎重さが求められます。

Developer Creates Infinite Maze That Traps AI Training Bots
https://www.404media.co/email/7a39d947-4a4a-42bc-bbcf-3379f112c999/
Nepenthes
https://zadzmo.org/code/nepenthes/

コメント

Translate »
タイトルとURLをコピーしました