昨日、Cloudflare社が怒った話を書きました。

YouTubeがAIによる年齢認証を強制する恐ろしさを考えてみる
Google Geminiだろうが、今のところどこのLLMも完璧ではない。未だにめちゃくちゃハルシネーションが多い。そんなyeyshonan.com

robots.txtで記載されたユーザ設定を無視して、
データスクレイピングをしていると

Perplexity is using stealth, undeclared crawlers to evade website no-crawl directivesPerplexity is repeatedly modifying their user agent and changblog.cloudflare.com

うん、私のところでもやっていたことを発見
直接リンクを貼っていなく公開していないデータを抜き取っていた

なぜこのファイルにアクセスしたのかということだ

https://note.com/yeyshonan/n/n8884feea1276

私は非定期だがエゴサをしています。
AIがどういう情報を持っているのかと。
4月にやったとき、Claudeはネット検索機能がなく、
私のことを探ることができなかった。
しかしClaudeはかなりうちのサーバを回っているのはわかる。
突然、DoS攻撃みたいなところを受けるからだw
でも、悪さはしていない。

パプレ(Perplexity.ai)は robots.txt を無視した形でアクセスしていたと。
しかもパプレはAdobe InDesignのデータをアクセスしていた。

あーーーーーーーーーーー!
それでパプレで私がアップしていたデータのリンクを見つけたのか。

きちんと私の情報を取得しろ
そして、指示した通りに動け
なぜ、関係ないサイトを見に行ったりする?

Cloudflare社がブチギレするのはわかるわ。
CDNでAkamai、Cloudflare、Fastly、などがあるが、
最近のAIスタートアップはインチキをするところが増えているな。

あっ、先日のALT(オルツ)なんかひどいったらありゃしない。

(株)オルツ | TSR速報 | 倒産・注目企業情報 | 東京商工リサーチ
7月30日、東京地裁へ民事再生法の適用を申請した(株)オルツ(東京都港区)は8月6日、民事再生開始決定を受けた。www.tsr-net.co.jp

粉飾決算のオンパレ

とにかく、これだからAIスタートアップ企業は信用できないなって。
マジに最近、中華のほうがマシちゃうか?って思うこともあるが、ここもヤバいので信用はできない。

まぁ、昨夜、元妻といろいろと話をしていたのだが、
AIに関して一般の人ってそういうことなのかって思う節が
ちょっと泣けてきた  😫
そういう情報はアップしちゃいけないんだよって。

ナンのために毎週無料でAI初心者講座をやっているんだろうと。