_ いや、つながらなくてお祭になってる某アレは、わしのせいじゃないからね。ほんとだよ。
_ ISPによるヘビー・ユーザーへの追加課金を許容,総務省懇談会が報告書案。えー、トラフィックの多いユーザに追加課金するのに合理的根拠がある、って今さら何いってんのって感じだなぁ。トラフィック課金ってすでに実施されて広く定着してるでしょ。携帯電話がパケット量に応じた従量課金してるのが「トラフィックの多いユーザへの追加課金」でなくて何だというのさ。もちろん、携帯電話のトラフィックは Winny なんかに比べたら大したことないけど、たくさん使ったユーザからはたくさん徴収、という意味ではまったく同じだよね。
_ spamhaus がオーストリア NIC の IP アドレスをブラックリストに登録したそうな。もちろん nic.at 自身が spam を送ったわけではなく、.at ドメインの phishing サイトに対して何のアクションもおこさなかったから、というのが理由らしい。現在は解除されてるみたいだけど、なんともはや。
_ 最近のボットはひとつのホストに対して大量に spam を送ることはせず、たくさんのホストに1通ずつ送るという戦略を取ってる。これはレート制御を回避するためと、1通届いたらもうそれっきり届かない大量の IP アドレスをいちいち DNSBL に申告するようなヒマな人はそんなにいないからだと思われる。spam 発信源が第三者リレーのホストで数が限られていたころとは違って、大量のボットからこんなふうに広く薄く送られると、送信元 IP アドレスによるブラックリストが作りにくくなって有効性がかなりあやしくなってくる。少なくともボットからの spam をブロックするという目的においてはもはや破綻してるよね。実際、ORDB は それを理由に終了したわけだし。
_ spamhaus の最近のアグレッシブな姿勢ってのは、spam を撃退することよりも、破綻しかかっている DNSBL が見捨てられるのを食い止めるためにとにかく自分たちの存在感をアピールすることの方が目的になってねーか。少しぐらい false positive になってしまっても、そのことが話題になって議論になって spamhaus の名前が前に出てくるのならヨシ、と。いや、もちろん実際はそんなことはないだろうし、誹謗中傷と受けとられてもしかたのない根拠レスな邪推なんだけど、でもそんな勘違いしちゃいそうなぐらいムチャなエスカレーション (*1)をしょっちゅうやってる。これだけを基準にブロックするのではなく、たくさんある判定材料のうちのひとつとして使うのならばまだなんとかならないでもないんだけど、逆に言えばそうでもしないと使うには危なすぎる。
_ 最終的にはその DNSBL を利用する人の選択なので、そういうクロとは言えないところまでリストするな、とは言わんのだけど、せめて「実際に spam を送ってきた IP アドレス(客観的事実)」と「spam は送ってないんだけどエスカレーションしちゃうよ(主観的判断)」はわけて扱ってくれないかな。前者が破綻した現在では後者を扱わないことには存在感を固持/誇示できないんだろうけど(で、こっちの方が毎度議論の種になる)、両者を同列に扱うのは明らかにムリがあると思うんだけど。
_ それから、リストに載せてすぐにはずす、といったように警告を与える目的で使うのもやめてくれんかな。自分たちの権威というか何というかを笠に着てるようで気分わるい。載せたりはずしたりが短期間でおこなわれていると、ものすごく恣意的な基準で運用されてるように見えるんだよね。もちろんほんとうに対処完了したから解除されることもあるんだろうけどさ、今回の nic.at の件なんてちゃんと改善されたのか外部から検証可能なんだろうか。
_ 繰り返すけど、spamhaus(に限らず DNSBL 全般)の登録基準がアレだとしても、最終的な責任はそれを利用することに決めたユーザの方にあって spamhaus ばかりを悪者にはできない。自分が使っているデータベースの中身がどんな性質のものなのか、ユーザの方がちゃんと知らなきゃいけないんだけど、その知る手助けとして spamhaus の方も自分たちのリストを使うことで生じうるデメリットをもっともっと知らせる努力をしないといかんよね。
_ というわけで、若干 FUD ぎみに煽ってみました。言いがかり的なところがあるのは承知してるので割り引いて読んでね:-)
(*1): ブロックする対象を拡大するという意味の spamhaus 用語
_ 東大、日時情報だけで迷惑メールを90%振り分け 新フィルター技術を開発。すげぇ。spam は四六時中ひっきりなく届くけど、仕事のメールは平日の昼間がほとんどだし cron のメールは定刻に届く。だから日時によって spam の割合が違うのはわかりきってるんだけど、いや、でも、たったそれだけの情報で9割の精度で判定できるってまぢですか。
_ でも、何かの理由で明け方にメールが届いたら spam 判定されるんだよね、きっと。海外とのメールのやりとりが多い人だと誤爆しまくりそう。昼間に仕事でメールを使う人はわりと精度が出るだろうけど、プライベートな用途ではわりと不定だから誤爆しそう。というわけで、シロかクロかではなく、スコアを加算するやりかたでないとたいへんなことになりそう。それとも、わしの予想もつかないスゴい方法でうまく回避してるんだろうか。
_ おまけ。日付情報、つーか Date: ヘッダで判定。postfix の header_checks でどぞ。
この3つのルールにひっかかって蹴った spam を数えてみたらが1ヶ月で350通あった。3番目のものだけで300通。spam 全体からしたら 5% にも足りないぐらいだから微々たるものだけど。/^Date:.*[^ -z\t]/ REJECT # 月や曜日が2バイト文字 /^Date: [-: 0-9]*$/ REJECT # 2007-06-27 12:34:56 という不正な形式 /^Date: *\t/i REJECT # Date: の直後に TAB (不正ではないが spam 以外では見ない)