Anthropicによるサイトのスクレイピングを防ぐrobots.txtの内容がすでに古くなっているという指摘、クローラーは24時間で100万アクセスしている事例も

2024.07.30 11:31
Livedoor.com

生成AIの流行により、ネット上にコンテンツを公開している企業や組織が、トレーニングデータとして使われないように対策を行う事例が出てきています。対策の1つはサイトのクローラーに対してアクセスを許すページとアクセスを許さないページを示す「robots.txt」を用いた方法ですが、実態として、Anthropicのクローラーを防ぐための内容はすでに使われていないクローラーの名前になっていて、使用中のクローラーは防げていない状況になっているそうです。Websites are Blocking the Wr 全文GIGAZI…

検索

人気記事

2024.08.10 3:00
2023.12.23 20:00
2024.09.10 12:58
2024.09.12 23:26
2024.01.17 11:47

コメント一覧

まだコメントはありません。

コメント