ボットでないことを確認する仕組み

#Tech

ウェブサイトの管理者は、AI企業による積極的なウェブスクレイピングからサーバーを防衛するため、Anubisというシステムを導入しています。

Anubisは、メールスパム対策と同様のPoW(Proof-of-Work)スキームを利用しています。

この仕組みは、個人の利用では負荷が軽微ですが、大量のスクレイパーが利用する際にはコストを大幅に増加させます。

ただし、現状は暫定的な解決策であり、今後はフォントレンダリングなどの技術を用いてヘッドレスブラウザを識別し、正規ユーザーへの認証提示を減らすことを目標としています。

ウェブサイトの管理者による、AIによる大規模なデータスクレイピング対策として「Anubis」という仕組みが導入されたことが明らかになりました。これは、AI企業などがウェブサイトから大量の情報を自動で抜き取る行為(スクレイピング)を防ぐための技術的な防御策です。

AIスクレイピングへの対策技術

Anubisは、Hashcashというメールスパム対策で提案されたプルーフ・オブ・ワーク(PoW)方式を応用した仕組みです。ユーザーに対して、一定の計算処理を要求することで、自動化されたボットによる大量アクセスを抑制します。この追加の負荷は個々のユーザーレベルでは無視できる程度ですが、大規模なスクレイパーが利用するとコストが膨大に増大する仕組みです。

PoW導入の目的と課題

このPoWの導入は、AI企業による無許可のデータ収集を防ぐための「暫定的な解決策」とされています。最終的な目標は、ヘッドレスブラウザ(ブラウザの操作を自動化するプログラム)の指紋採取などにより、正規のユーザーにPoWの課題を提示する必要がない状態にすることです。

技術的な制約と利用上の注意点

Anubisの動作には、最新のJavaScript機能の使用が必須となっています。そのため、JShelterのような特定のブラウザ拡張機能やプラグインを使用している場合、それらが機能を無効化してしまう可能性があると注意喚起されています。利用者はこれらのプラグインを無効化する必要があるとのことです。

まとめ

Anubisは、AIの進化に伴うウェブサイトへの負荷増大という新たな課題に対し、技術的な防御壁を築こうとする試みです。今後のより高度な識別技術の開発が期待されます。

原文の冒頭を表示(英語・3段落のみ)

Loading...You are seeing this because the administrator of this website has set up Anubis to protect the server against the scourge of AI companies aggressively scraping websites. This can and does cause downtime for the websites, which makes their resources inaccessible for everyone.Anubis is a compromise. Anubis uses a Proof-of-Work scheme in the vein of Hashcash, a proposed proof-of-work scheme for reducing email spam. The idea is that at individual scales the additional load is ignorable, but at mass scraper levels it adds up and makes scraping much more expensive.Ultimately, this is a placeholder solution so that more time can be spent on fingerprinting and identifying headless browsers (EG: via how they do font rendering) so that the challenge proof of work page doesn't need to be presented to users that are much more likely to be legitimate.Please note that Anubis requires the use of modern JavaScript features that plugins like JShelter will disable. Please disable JShelter or other such plugins for this domain.

※ 著作権に配慮し、引用は冒頭3段落までです。続きは元記事をご覧ください。

元記事を読む ↗