|
|
Обучение против чёрных списков IP-адресов
Agava Spamprotexx обучаем. Некоторые пользователи избегают обучаемых спам-фильтров, так как убеждены, что обучение — долгий и утомительный процесс, основанный на расплывчатых критериях. Эти пользователи предпочитают фильтры, основанные на таких чёрных списках, как SpamCop, ORDB, DSBL, SPEWS и другие.
Миф первый. Чёрный список — это объективный критерий. Позвольте немного рассказать о том, как работает чёрный список. Скажем, есть хостинговая компания, которая оказывает услуги по хостингу электронной почты, и есть клиент, решивший однажды разослать спам. Из-за него IP-адрес хоста (или чаще группа IP-адресов) могут попасть в чёрный список как спам. Что происходит, если адреса попадают в чёрный список? Как результат, Вы перестаёте получать почту от всех клиентов этой компании!
Вы можете сказать: плохая хостинговая компания — плохие клиенты. Может и так, но суть не в этом. В то время как плохая компания решает проблему с одним плохим клиентом, страдают все её остальные — невиновные клиенты. Такой подход не может быть эффективным.
Миф второй. Статистические критерии не объективны. Если не вдаваться в подробности, то фильтр, работа которого основана на статистических методах, анализирует каждое слово, которое он находит в почте, и сопоставляет с таким же словом из базы данных, где у него есть спам-коэффциент. Анализ содержания поступающих сообщений имел ряд неудачных попыток реализации, которые испортили представление об этом методе. Эти фильтры имели некоторое число предопределённых слов/коэффициентов, которые поднимали вероятность того, что сообщение является спамом, простым приращением спам-значения сообщения. Элементами, которые увеличивали спам-счёт, могли быть инструкции по удалению из списка рассылки (Unsubscribe), HTML с цветным фоном, такие слова, как «free» или «spam». Эти фильтры были известны как «убийцы почтовых рассылок», потому что если несколько таких элементов присутствует в нормальной почтовой рассылке (а это почти всегда так), то она будет отнесена к спаму и, соответственно, удалена. Издатели информационных бюллетеней злились и использовали трюки вида «sp*m» или «fre*e». Функционирование таких фильтров сильно отличается от того, как работает Agava Spamprotexx.
Во-первых, формула, по которой рассчитывается итоговый спам-счёт, достаточна сложна (не линейна). Т.е., вместо простого сложения коэффициентов происходит сопоставление количества так называемых спам-слов с размером всего сообщения. Если встретится дюжина спам-слов в длинном письме о приготовлении пищи, то Spamprotexx не будет помечать его как спам.
Во-вторых, Agava Spamprotexx обучаем. У него нет конфигурации «по умолчанию», но он обучаем. Вы не можете настроить коэффициенты самостоятельно, но можете представить для обучения сообщение целиком. Это объективно страхует от человеческой ошибки, а также означает, что статистические коэффициенты основаны на Вашей личной почте.
Вместе эти факторы позволяют Spamprotexx быть достаточно объективным и обеспечивают хорошие результаты.
|