ニュース
Twitterがログインしないと閲覧できない状態に マスク氏「一時的な緊急処置」「データの略奪でユーザーのサービスが低下していた」(2/2 ページ)
いつごろ戻るのでしょうか。
advertisement
「Twitterのウェブ版では、ログインせずに閲覧することができなくなりました。すべてのURLはサインアップページにリダイレクトされます。これは、ChatGPTのウェブ閲覧プラグインが行ってきたような、スクレイパーによるTwitterのデータ持ち出しを困難にするための措置と考えられている」(以下、DeeoLによる翻訳)
「一時的な緊急措置。データが略奪されすぎて、一般ユーザーのサービスが低下していました」
「AIのスクレイピング戦争がいよいよヒートアップし、Webはオープンで使いやすいものではなくなっていくだろう。redditがアプリを強制したり、twitterがアカウントのないユーザーをブロックしたり、discordがインデックスされなくなったり。これに対する良い解決策はまだ見つかっていない」
advertisement
「認証されていないアクセスを許可しているソーシャルメディア企業は、関連性が高まるやいなや、botだらけの地獄絵図になるだろう」
「洞察: Twitterは、Webサイトを閲覧するためにログインを要求することで、スクレイピングを難しくしている。BeautifulSoupのようなツールはHTMLを解析するだけで、JavaScriptとやりとりすることはできない。しかし、ブラウザのようなインタラクションを可能にするSeleniumを使えば、データにアクセスするためにログインするプロセスを自動化することは技術的に可能だ。Seleniumはフォームに入力したり、ボタンをクリックしたりすることができるので、ログインプロセスを自動化することができる」
「もちろんです。これを軽減するために、われわれはまた、アカウントごとに、特に新規アカウントごとにダウンロードできるデータ量の制限を厳しくしています」
「インターネットはますます壊れている。ニュースサイトは有料かアカウントの壁で囲まれ、Redditは長ったらしい壁で囲まれ、Google検索は使い物にならないほど広告やSEOをスパムし、今やTwitterはアカウントの壁だ。Webブラウジングは今、恐ろしく感じられる」
「数百の組織(もしかしたらそれ以上かもしれない)が、実際のユーザーエクスペリエンスに影響を与えるほど、Twitterのデータを非常に積極的にスクレイピングしていた。それを止めるにはどうすればいいのか?アイデアをお待ちしています」
advertisement
「インフォセック・エンジニアリングでスクレイピング・パターンを阻止し、利用規約で悪質な形態のスクレイピングを禁止し、量に基づく清算的損害賠償条項を追加し、大規模な商業的乱用に対して目立つように訴訟する」
「笑」
「1. スクレイピングはT&Cですでに認められていない。2. スクレイピングを行う組織は、プロキシサーバや合法的に見える組織を使ってIPを隠している。例えば、オラクルのIPアドレスから発信された最近の大規模なスクレイピングは、オラクルのサーバをコインランドリーとして使っていただけだった。3. 私たちは、私たちのデータを盗んだ者たちに対して絶対に法的措置を取るつもりであり、法廷で彼らに会うのを楽しみにしている」
おすすめ記事
advertisement
関連記事
Copyright © ITmedia, Inc. All Rights Reserved.