35年前にあの事件が起こって以来、ずっと漫画も北朝鮮の工作員に拉致されつつもバンジージャンプでひもをつけるのを忘れて死んだ。あくまで架空である。
個々の文章を見てみると、ぱっと見は普通の文章に見えるが(ちょっと、えげつないけど)、きちんと読むと文の間の意味が全くつながらない。これはプログラムなどで自動的に作られた、デマカセの文章を載せまくっているブログである。ワードサラダという技術は、複数の単語を適当に組み合わせて、スパムを取り除くフィルターからはちゃんとした文章に見える文章を作る技術なのだ。
人気のあるキーワードを散りばめることでサーチエンジンでのランキングを上げ、ブログ内のサイトにおいてあるリンクに誘導することでアフィリエイト収入を得ているのだ。ちなみに、人気のあるキーワードとは、叶恭子や、食中毒、北朝鮮の工作員、バンジージャンプ。
こんなサイトはユーザにとっては非常に迷惑だし、アフィリエイト代を支払うGoogleなどの業者にとってもたまったものではないので、必死に対策をとっているのだが、なかなか自動的に判別するのは難しいようだ。
まず、基本的な対策法としては、ユーザからの報告で悪質なサイトをリストアップし、そのIPアドレスをさらし者にするもの。Splogspot が著名なようだ。
また、自動的に判別する手法としては、TrustRankのように、信頼のできる有名サイトからリンクが辿られるサイトを信頼できるサイトとし、スパムブログをいぶりだす、というやり方もある。(スパムブログは信頼できるサイトからリンクが張られていないという前提で。)
ちなみに、ふと思ったのだが、初期のMBAマッチョ日記は英語で書いていたのだが、そのたどたどしい英語ブログがネイティブの目にひっかかって、スパムブログだと勘違いされ、Splogspotに報告されたりしたら、非常に悲しい。スパムブログの対策技術に、ふと身の危険を感じたのだった。
関連記事
http://en.wikipedia.org/wiki/Splog
http://www.blogwatcher.co.jp/kensuu/2007/07/post_4.html