Anthropicによるサイトのスクレイピングを防ぐrobots.txtの内容がすでに古くなっているという指摘、クローラーは24時間で100万アクセスしている事例も

2024.07.30 11:31
Livedoor.com

生成AIの流行により、ネット上にコンテンツを公開している企業や組織が、トレーニングデータとして使われないように対策を行う事例が出てきています。対策の1つはサイトのクローラーに対してアクセスを許すページとアクセスを許さないページを示す「robots.txt」を用いた方法ですが、実態として、Anthropicのクローラーを防ぐための内容はすでに使われていないクローラーの名前になっていて、使用中のクローラーは防げていない状況になっているそうです。Websites are Blocking the Wr 全文GIGAZI…

検索

人気記事

2024.11.21 21:27
2024.03.26 6:00
2024.11.21 20:37
2024.11.21 9:00
2024.11.21 16:45

コメント一覧

まだコメントはありません。

コメント