Как собрать базу для проспамки
Июнь 15, 2009 Поисковая оптимизация
То тут, то там по интернету натыкаюсь на вопрос как собрать базу для скажем получения беков. Продаются базы, продается софт, все борются за выживание...
На самом деле нихуя сложного в этом нет. Итак как всегда по шагам. Го!
1. Нужен источник способный отобрать много подходящих сайтов. Для наших целей по большому счету подойдет любой поисковик. Делать будем на примере гугла.
2. Теперь нужно посредством этого самого гугла выделить требуемую группу сайтов. Например гостевые. В интернете большая часть сайтов использует стандартные движки гостевых книг, с более или менее стандартными настройками. И это нам блять наруку. Тупо вбиваем в поиск «guestbook add». На выходе имеем 18,5 лямов страниц. Причем это страницы добавления. Я думаю нам хватит.
3. Понятное дело, что разбирать этот завал в ручную дело неблагодарное поэтому идем снова в гугл и ищем «парсер выдачи гугла». Кому лень качаем
4. Далее запускаем скотинку и вбиваем наш запрос. Только что я чуть более чем за 10 минут напарсил 1200+ ссылок. .
5. Забиваем полученное в какой-нить аллсабмитер и вперед...
Изложенное выше только пример, понятно что в указанной базе довольно много мусора, но я думаю в целом идея ясна. Ну а посмотреть имена файлов в основных скриптах интересующей тематики у вас несомненно ума хватит...
Удачного полета.
Метки: база гостевых, Манимейкерство, парсинг, Поисковая оптимизация