March 19, 2019

Фильтруем базар... То есть базы! Фильтруем базы!

Чистить базы от мусора важно, и нужно. Так как при каждой отправке писем на всякие несуществующие почты типа [email protected] или [email protected] падает трастовость твоих серверов, сокращается время жизни твоих доноров, уменьшается член, и где-то в мире погибает один щеночек

Так же среди левых баз могут попасться почты на которые лучше не слать НИЧЕГО. Например до сих пор жива почта Стива Джобса, и многие спумеры при отправки письма на неё в тот же день ловили блок на свои сервера. Ибо нехуй, пусть покоится с миром дядька. Так-же у некоторых компаний есть свои почты специально для приёма жалоб на спам, типа [email protected]. Очень круто самому туда свой спам положить и попасть в черный список. Ну суть понятна, я думаю. К делу!

Для этого тебе понадобиться Email utilita, я тебе её кидал в телеге, и для её корректной работы нужно будет поставить net framework. ХЗ какой, я поставил 4.7 и норм всё работает. Можно и без этого, но некоторые приятные функции работать не будут.

Ещё один момент - программа немного прожорлива на оперативу, в виртуалке ей лучше выделить чуть побольше памяти.

Шаг 1. Парсим почты

Этот шаг нужно делать в случае если в базе есть не только почты, а ещё например ФИО, Телефоны, что угодно. Если в файле только почты по одной в строчку - этот шаг можно пропускать смело.

Возьмём для примера такую базу паблик - Монетизация трафика. Там такая картина

Много лишнего, нам нужны только почты. Да можно в этом же редакторе взять и выдрать эти почты из этого файлика. а если у тебя таких фалйлов 10-15-20? Нахер нужно! Открывай е-мейл утилиту и жми "E-mail парсер (4 в 1)" и в следующем окне уже "Файл" или если нужно много файлов обработать то "Папка". Указываешь файл (или папку с файлами) и программа сама соберёт все почты что найдёт и сохранит их в папку "Парсер" рядом с собой. Красота.

Шаг 2. Удаляем бяку и очепятки

Если база ещё новая то с ней стоит совершить ещё два действия

  1. "Удалить блек-лист" - удаляет все почты с служебными названиями типа admin@ info@ abuse@ и т.д. очень хорошая штука. Сохранит выхлоп в папке Блек-лист
  2. После, к базе без почт из блек-листа следует применить "Исправление опечаток в доменах" что-бы привести gmail.ru mali.ru yandks.ry и всё такое в человеческий вид, таких исковерканных почт бывает дохера, и как не сложно догадаться это почты немамонтов (ну по большей части)

Шаг 3. Сортируем и удаляем мелочь

Базу нужно рассортировать по доменам. "Сортировать базу" >> "Каждый домен в свой файл". После переходим в папку с выхлопом и видим такую картину

Для наглядности, лучше включить сортировку по размеру, а не по алфавиту. Куча почт мэйла, гугла, яндекса, ещё нескольких более-менее крупных почтовиков, а потом какая-то муть и мусор. Вот всю муть и мусор мы выделяем и удаляем к хренам собачим! Или переносим в отдельную папочку, возможно из этого всего получится выудить немного буржуйскийх почт залётных, например .lv это латвийские почты, этакий русскоязычный бурж. Но это другой разговор. В любом случае отделяем "Бигов" от всякой мелкотни. в данном случае я выделил всё что меньше 7кб и удалил. Самое главное удалить всякие корпоративные почты и несуществующие домены.

Шаг 4. Склеиваем обратно

Теперь оставшиеся файлики нам нужно склеить. Тут всё просто "Склеить базы в один файл". Всё.

Шаг 5. Перемешиваем

Сейчас почты в файле нашем идут группами по доменам, а это не хорошо, как и в случае если они отсортированы по алфавиту. Так рассылка будет идти сначала со всех серверов на один почтовик массированно, потом на следующий, и т.д. Поэтому нам обязательно нужно перемешать базы. Это тоже делается так "Упорядочить или перемешать строки (2 в 1)" >> "Перемешать". Всё.

Шаг 6. Делим на равные части

Последнее что тебе нужно будет сделать, это нарезать базы на кусочки, что-бы загрузить их в Мегаинбокс. Хоть мега и говорит что можно за раз загружать 100 тысяч почт, но на деле иногда она даже 90 тысяч отказывается кушать. Поэтому выбираем "Разделить большую базу на части" там указываем 85000 (ну что-бы наверняка всё загрузилось) и выбираем "строк". Указываем наш почищенный и перемешанный файлик с почтами, и на выхлопе получаем папку с n-ым колличеством файлов по 85к почт в каждом. И всё это добро уже загружаем в мегу и радуемся доставкам, профиту, жизни.