Специально для тех кто хочет научиться писать грабберы
Итак какие фукции нам нужны
file_get_contents() - функция которой мы будем "граббить" содер жимое чужого сайта
preg_replace() - функция которой мы вырешем все лишнее (реклама дивы и тп)
str_replace() - функция которой мы будем заменять урл"ы и тп
Жертвой мы выбрали сайт
http://mobkino.org
Поехали:
создаем файл
index.php в него прописываем
<?php
//тырим содержимое сайта
// выводим его
echo $file;
?>
переходим по урл/index.php и видим все содержимое сайта
теперь просматриваем html код страницы и убираем все лишнее (рекламу и тп) оставляем только разделы
<?php
$file=preg_replace('|<?xml(.*?)По годам</a> </div>|is','',$file); ?>
вы наверное уже заметили что мы вырезали все от
<?xml (шапки сайта) до
По годам</a></div> (начала самх разделов)
теперь создаем файл
gallery.php (его пока не трогаем)
пытаясь заходить в какую нибудь категорию у вас возникает ошибка 404 тк наш урл - сайт.ру/films.php?gid=ид раздела
затем заменяем эти ссылки на наши
теперь переходя в какую-нибудь категорию вы будете попадать по сайт.ру/gallery.php?gid=ид раздела
вы видете что в этом урл передается методом GET ид раздела
Используем это в файле
gallery.php
<?php
// тырим содержимое раздела
$file = file_get_contents("http://mobkino.org/films.php?gid=".$_GET['gid']."&".$_SERVER['QUERY_STRING']); // вырезаем верх сайта
$file=preg_replace('|<?xml(.*?)<div class="wapstart-plus1-ad"></div>|is','',$file); // вырезаем низ сайта
$file=preg_replace('|<div class="wapstart-plus1-ad-bottom"></div>(.*?)</html>|is','',$file); // меняем урсл картинок постеров
$file = str_replace('<img class="poster" src="content','<img src="http://mobkino.org/content', $file); // убираем все не нужное
$file = str_replace('<img src="images/red_icons/rek.gif" alt="рекомендуем" />','', $file); // заменяем урлы на наши
$file = str_replace('films.php?gid='.$_GET['gid'].'&start','gallery.php?gid='.$_GET['gid'].'&p',$file); // меняем название сайта на наше
// выодим
echo $file;
?>
вот випринцепе и все
по данному образцу мы можем "грабить" практически любой сайт (если он доступен для просмотра без авторизации)
если у вас еще возникли вопросы то задавайте
(c) KpuTuK 2013
и пусть рука отсохнет у того кто удалил предидущую статью