Как бороться со спамерскими комментариями в блогах

stop spamПочти с самого открытия блога в статьях стали появляться комментарии от спамеров со ссылками на какие-то ресурсы или прямыми рекламными объявлениями. Я такие комментарии старался удалять, но порой их не так легко распознать.

Одно дело, когда комментарий оставляет робот. Такие вещи лечатся введением капчи, что я, собственно, недавно и сделал. Однако, чтобы не усложнять жизнь честным посетителям, желающим написать отзыв, я сделал простейшую капчу с арифметическим выражением. Похоже, что это довольно легко обходится роботами, т.к. явно автоматические комментарии продолжали изредка появляться. Тогда я добавил простую графическую капчу, и комментарии ботов пропали совсем.

Однако, похоже, никакая капча не решит проблему, если спамерский комментарий оставляет живой человек. Пока я придумал несколько средств борьбы с этим.

Средства борьбы

  1. Введение запрета на анонимное комментирование не поможет, т.к. регистрация довольно проста, и если человек заинтересован в ссылке с моего сайта, он не поленится и зарегистрируется. А усложнять процедуру регистрации совсем не хочется.
  2. Можно ввести систему друзей, как в LiveJournal, но тогда далеко не каждый читатель захочет регистрироваться и ждать одобрения автора лишь для того, чтобы оставить единственный комментарий.
  3. Премодерация комментариев хороша всем, но требует постоянного мониторинга со стороны автора блога, что не всегда возможно, поэтому могут возникать большие задержки с публикацией. Но такая система сделана у некоторых известных блогеров, например, lleo.
  4. Возможно, есть какие-то общедоступные базы спамеров, по которым можно проверять домен, указанный в комментарии. Но я о таких базах не слышал.
  5. Недавно я добавил тег <noindex> вокруг блока комментариев (прошу прощения за такую нехорошую вещь :). Возможно, это проверяется спамерами, желающими оставить ссылку, потому что их ссылка в таком случае работать не будет. Но в этом есть свой минус – полезные комментарии не будут проиндексированы поисковиками, а ведь часто многие важные замечания к статьям даются именно читателями.

Каковы цели спамеров в блогах

Я вижу три:

  • реклама чего-либо – сайта или услуги;
  • увеличение ссылочной массы на свой ресурс для его продвижения;
  • простое вредительство (троллинг не считается спамом, но тоже пользы никому не приносит).

Вредителей и троллей встречается сравнительно мало, желающих оставить открытую рекламу тоже не так много, и это обычно боты. А вот тех, кто хочет получить ссылку больше всего. И это будет продолжаться до тех пор, пока поисковики не станут умнее. А вообще, существует ведь «официальный» способ раскрутки через ссылочные биржи, который учитывает согласие автора ресурса на размещение у себя ссылки. Неужели это так уж дорого стоит, чтобы днями бродить по блогам и пытаться оставить бесплатные комментарии, которые в большинстве случаев удаляются? Сами ссылочные биржи – это тоже не совсем честная технология, но все-таки, они лучше, чем открытый спам. Здесь автор сайта хотя бы получает вознаграждение :)

Чем вредны спамерские комментарии

Для читателей. Приходится постоянно фильтровать информационный мусор, как на сайтах, так и в почте, в случае получения уведомлений.

Для авторов сайтов. Необходимо постоянно проверять новые комментарии. Почтовый сервер, через который отправляются уведомления о комментариях, может занести адрес сайта в черный список, если от него будут отправляться письма со спамом. Мне, например, довольно регулярно не приходят почтовые уведомления, и, думаю, именно по причине попадания под спам-фильтр. Для таких случаев можно исключить из тела письма текст комментария и оставлять только ссылку.

Выводы

Пока будет существовать хоть какая-то выгода от размещения спама, авторам сайтов придется продолжать тратить время и силы на борьбу с ним. Особенно тяжко приходится популярным сайтам с высокими тиц/PR, т.к. они являются гораздо более привлекательными для «оптимизаторов». Будем надеяться, что когда-то нам удастся побороть эту проблему окончательно.

Ну вообще, конечно, все уже придумано до нас.

1. Для друпала есть модули Akismet и Mollom. Они по умному фильтруют спам.
2. Для Wordpress кроме этого есть Parasite Eliminator, работа которого основана как раз на черных и белых списках доменов. Для друпала вроде еще не сделали.

noindex вокруг всего комментария - это, конечно, не очень хорошо. Хотя как временное решение, пойдет. Но лучше сделать так:
1. noindex только на ссылку в заголовке (имя).
2. Сделать еще один фильтр содержимого, в котором все ссылки будут автоматически заключаться в noindex или nofollow. Это не сложно, надо просто разобраться с фильтрами. Мне до сих пор было банально лень.

Но. Даже если каменты в noindex - это не спасает от спамеров. Они тупые и в код не смотрят.

Модули для Drupal попробую, спасибо! Надо только, чтобы они подозрительные комментарии не удаляли, а складывали в какую-нибудь папку "Спам", для дальнейшей модерации.

Noindex перенесу в заголовок комментария.

Можно дополнительно ввести премодерацию только по ключевым словам. Например, если встречается слово "http://" - скрывать этот комментарий, но при этом высылать тебе уведомление. В дальнейшем, эту премодерацию можно отключить для тех людей, кто более/менее постоянно пишет не спамерские комментарии: идентифицировать таких можно по полю e-mail, который не показывается на сайте.

Спасибо. Надеюсь, в модулях для Drupal, упомянутых выше, такая функциональность есть.
Кстати, подтверждение того, что я сказал - на оба комментария, оставленные на эту статью, не пришло подтверждения по почте. Видимо, все-таки попал мой сайт в черный список.

Не понял, какой черный список? Уведомление по почте - это вопрос сугубо корректной работы модуля, который у тебя отвечает за рассылку и почтового сервера. Каменты с моего блога ходят, значит с сервером все в порядке. :-) Вывод - что-то не так с модулем рассылки уведомлений.

А, блин. Вот написал и вспомнил - мне то как раз пришли на почту все уведомления об этих каментах. Значит таки работает, но как-то странно.

Да, похоже, CommentNotify глючит. Мне только что тоже пришло уведомление о твоем комментарии.

А можно оставить это на усмотрение читателей, чтобы они могли выставлять флаги, а потом блог по умолчанию скрывал записи "в большом минусе".

Можно, но мне кажется, делать систему, сходную с Хабром, в личном блоге - это уж слишком :) Я подумаю.

заменять ссылку http://site.com/ или www.site.com на ссылки вида
http://www.claris-verbis.ru/goto?http://site.com/
или
http://www.claris-verbis.ru/goto?www.site.com

Скрипт goto перенаправляет на правильную страницу (код ниже).

Поисковики такие ссылки не считают, а пользователь по ней перейдет, если захочет.

// код goto.php
if ( strstr($_SERVER['QUERY_STRING'], "http://www.claris-verbis.ru/goto") )
$LINK = str_replace("http://www.claris-verbis.ru/?", "", $_SERVER['QUERY_STRING']);
else
$LINK = $_SERVER['QUERY_STRING'];

if ( !strstr($LINK, "http://") )
$LINK = "http://".$LINK;

header("HTTP/1.1 302 Found");
header("Location: ".$LINK);

О! Вот это действительно здорово! Так, кстати, сделано на Хабре для статей-ссылок. Спасибо за подсказку, я, наверное, на этом варианте остановлюсь.

а собственно для чего все это
чем мешают ссылки в коментариях

Спамерские комментарии замусоривают статьи и доставляют неудобства читателям, т.к. некоторые подписаны на новые комментарии по почте.

Ссылки в честных комментариях не мешают, т.к. автор просто посчитал нужным указать свой сайт.

А от ссылки в спамерских комментариях может быть прямой вред - поисковые сервера вполне способны наказать за такие ссылки понижением в выдаче (выдача зависит от PR/ТИЦ). Если комментарий ссылается на сайт, уличенный в купленных ссылках, то и блог может быть забанен за размещение продажных ссылок.

Не могу понять почему столько внимания уделяют комментариям считающимися как спамы. Ещё слово фильтрация, ведь комментируют запись для того чтобы её читали и не оставляли без внимания. Должны быть высказывания просто имеющие определённые рамки морали и не противоречащие уголовному праву, и всё. Или если всё это отвлекает, тогда надо просто запретить комментировать. Хотя в комментариях идёт так же огромный поток информации, улучшающий популярность блога.

Потому что читать комментарии, продираясь через горы рекламы и спама не очень приятно для тех же посетителей блога

Никак с этим не поборишься. Лучше уж всем давать спамить)

Отправить комментарий

КАПЧА
Пожалуйста, введите капчу (здесь ТОЛЬКО буквы!)
CAPTCHA на основе изображений
Enter the characters (without spaces) shown in the image.