Цитата:
Еще вопрос: если антиспамовский фильтр обучаемый, то почему бы не выложить его(уже обученного) тем, кто обучил?
Зайди сюда: http://www.ritlabs.com/ru/solutions/BayesIt.php
А вот и сама база из трех тыс писем: http://klirik.narod.ru/arc/spamdict.rar
Цитата:
[ВНИМАНИЕ! Подходит только к версиям начиная с 0.4fm.
Несколько слов об установке словаря: его необходимо распаковать в рабочую папку программы, перезаписав в рабочей папке файлы spamdict.bye, spamdict.idx и spamdict.lst. Я постарался включить в этот словарь то, что (по моему мнению) бесспорно является спамом — исключив всевозможные спорные письма. Однако даже в этом случае имейте в виду, что поскольку спам — понятие относительное, данный словарь на ваших письмах может давать ошибки. В частности — обратите внимание — если вы будете писать какие-то письма мне лично и я на них отвечу — то мои ответы в случае использования этого словаря, скорее всего, попадут у вас в "спам". Причина исключительно проста: поскольку словарь я создавал на своих собственных письмах, в нём фигурируют некоторые специфические данные (мой e-mail, ник и пр.), в то время как в вашей "хорошей" половине этих данных, скорее всего, нет. Лучший словарь спама — это словарь, созданный самостоятельно.