Wenn man Spam-Kommentare von Hand aussortiert und in den Papierkorb legt, könnte es interessant sein zu sehen, ob sich URLs, Autoren oder E-Mail Adressen in den Spam-Botschaften wiederholen und welche es schließlich sind.
Hier laufen zur Zeit drei Arten Spam-Kommentare auf:
- Da sind zum einen Autoren mit so klangvollen Namen, wie xbtxgqhsxy, jnoitl oder auch spxoshrkb und ihre nicht minder enigmatischen Botschaften, wie zum Beispiel: »OFkICe … href=“http://agulagevkiewecyy.com/“ rel=“nofollow“> agulagevkiewecyy …« Die angegebenen URLs sind im gleichen Stil aufgebaut.
- Die zweite Kommentar-Kategorie stellen die Einzeiler dar. Da ist dann zu lesen: »Wo ist der gefällt mir Button« oder »Guter Beitrag, werde noch mal drüber nachdenken«. Die Autoren heißen Dennis, Darko oder Sebastian und die URLs zeigen nicht selten auf Server, wie zum Beispiel: www.naehmaschinenzentrale-bielefeld.info oder www.luedenscheider-blogsyndicate.com.
- Die größte Arbeit machen sich die meist englischsprachigen Mehrzeiler. Von Kommentatoren, wie Vaughn Masilliaux, Curb Herionne oder Middie Oldestby ist zu lesen: »Thank you so much for providing individuals with an exceptionally memorable opportunity to read … ideas in this article are easily the most effective we have ever had.« Die URLs verweisen hier in der Regel direkt auf den Server ohne weitere Pfadangaben.
Wenn sich im Papierkorb eine nennenswerte Anzahl von bereits gelöschten Kommentaren befindet, kann man über kurze SQL-Abfragen zum Beispiel die Anzahl gleicher Autorennamen, E-Mail Adressen oder URLs ermitteln. Der Zugang zur WordPress Datenbank erfolgt in der Regel über phpMyAdmin. Nach Auswahl der WordPress Datenbank kann über den Reiter SQL ein kleiner Editor geöffnet werden. Mit der folgenden Abfrage werden aus der Tabelle wp_comments die mit Löschvermerk versehenen Datensätze selektiert. Dabei werden gleichlautende URLs gezählt und mit der Häufigkeit ihres Vorkommens in absteigender Reihenfolge ausgegeben:
select comment_author_url as URL, count(*) as Anzahl from wp_comments where comment_approved = "trash" group by URL having URL <> "" order by Anzahl desc limit 10;
Das Ergebnis könnte dann zum Beispiel so aussehen:
URL | Anzahl |
---|---|
http://nighttraincomp.com/sports-transport-south… | 17 |
http://www.clearvolume.info/duamcxma/posts/16375… | 15 |
http://www.crazynesbydry.net | 13 |
http://clearycare.uk/jailbreak/ | 12 |
http://www.seobankingteam.com/seo-bielefeld/ | 10 |
http://karo0u9an.pasterious.dk/ | 7 |
… |
Soll sich die Analyse auf freigeschaltete Kommentare beziehen, so muß in der Where-Klausel »trash« gegen »1« ausgetauscht werden. Weitere Abfragen nach comment_author oder comment_author_email wären ebenso denkbar.
rh2012-06-003