やはりパプレがrobots.txtを無視していた

昨日、Cloudflare社が怒った話を書きました。

YouTubeがAIによる年齢認証を強制する恐ろしさを考えてみる
Google Geminiだろうが、今のところどこのLLMも完璧ではない。未だにめちゃくちゃハルシネーションが多い。そんなyeyshonan.com

robots.txtで記載されたユーザ設定を無視して、
データスクレイピングをしていると

Perplexity is using stealth, undeclared crawlers to evade website no-crawl directivesPerplexity is repeatedly modifying their user agent and changblog.cloudflare.com

うん、私のところでもやっていたことを発見
直接リンクを貼っていなく公開していないデータを抜き取っていた

なぜこのファイルにアクセスしたのかということだ

https://note.com/yeyshonan/n/n8884feea1276

私は非定期だがエゴサをしています。
AIがどういう情報を持っているのかと。
4月にやったとき、Claudeはネット検索機能がなく、
私のことを探ることができなかった。
しかしClaudeはかなりうちのサーバを回っているのはわかる。
突然、DoS攻撃みたいなところを受けるからだw
でも、悪さはしていない。

パプレ（Perplexity.ai）は robots.txt を無視した形でアクセスしていたと。
しかもパプレはAdobe InDesignのデータをアクセスしていた。

あーーーーーーーーーーー！
それでパプレで私がアップしていたデータのリンクを見つけたのか。

きちんと私の情報を取得しろ
そして、指示した通りに動け
なぜ、関係ないサイトを見に行ったりする？

Cloudflare社がブチギレするのはわかるわ。
CDNでAkamai、Cloudflare、Fastly、などがあるが、
最近のAIスタートアップはインチキをするところが増えているな。

あっ、先日のALT（オルツ）なんかひどいったらありゃしない。

（株）オルツ | TSR速報 | 倒産・注目企業情報 | 東京商工リサーチ
７月３０日、東京地裁へ民事再生法の適用を申請した（株）オルツ（東京都港区）は８月６日、民事再生開始決定を受けた。www.tsr-net.co.jp

粉飾決算のオンパレ

とにかく、これだからAIスタートアップ企業は信用できないなって。
マジに最近、中華のほうがマシちゃうか？って思うこともあるが、ここもヤバいので信用はできない。

まぁ、昨夜、元妻といろいろと話をしていたのだが、
AIに関して一般の人ってそういうことなのかって思う節が
ちょっと泣けてきた 😫
そういう情報はアップしちゃいけないんだよって。

ナンのために毎週無料でAI初心者講座をやっているんだろうと。

月	火	水	木	金	土	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

やはりパプレがrobots.txtを無視していた

いいね:

関連

Related Post

2日続けて同じところを散歩

久しぶりに散歩

気づいたら今月全く投稿してなかった

やはりパプレがrobots.txtを無視していた

共有:

いいね:

関連

Related Post

2日続けて同じところを散歩

久しぶりに散歩

気づいたら今月全く投稿してなかった