DekusWorld - программирую на php за еду

на главную страницу

Как собрать базу для проспамки

То тут, то там по интернету натыкаюсь на вопрос как собрать базу для скажем получения беков. Продаются базы, продается софт, все борются за выживание...

На самом деле нихуя сложного в этом нет. Итак как всегда по шагам. Го!
1. Нужен источник способный отобрать много подходящих сайтов. Для наших целей по большому счету подойдет любой поисковик. Делать будем на примере гугла.
2. Теперь нужно посредством этого самого гугла выделить требуемую группу сайтов. Например гостевые. В интернете большая часть сайтов использует стандартные движки гостевых книг, с более или менее стандартными настройками. И это нам блять наруку. Тупо вбиваем в поиск «guestbook add». На выходе имеем 18,5 лямов страниц. Причем это страницы добавления. Я думаю нам хватит.
3. Понятное дело, что разбирать этот завал в ручную дело неблагодарное поэтому идем снова в гугл и ищем «парсер выдачи гугла». Кому лень качаем найденный мной парсер выдачи гугла
4. Далее запускаем скотинку и вбиваем наш запрос. Только что я чуть более чем за 10 минут напарсил 1200+ ссылок. База для проспамки гостевых Декус эдитион прилагается.
5. Забиваем полученное в какой-нить аллсабмитер и вперед...

Изложенное выше только пример, понятно что в указанной базе довольно много мусора, но я думаю в целом идея ясна. Ну а посмотреть имена файлов в основных скриптах интересующей тематики у вас несомненно ума хватит...

Удачного полета.