ку) Короче,вопрос кодерам, которые писали парсы/грабы на курле.. Каким образом при грабеже правильно выдераете.. постраничную навигацию? т.е какое регулярное выражение используете для создания новой курл инициализации (для слудующей страницы)?
к примеру инициализация
$lol = curl_init(\'http://лол.com/page/\'.$_SERVER[\'QUERY_STRING\']);
и регулярка типа
str_replace(\'<a href=\"/page/\',\'<a href=\"\',$lol);
вот такой головняк.
ваще так не делаю)
Добавлено 07.11.13 в 20:53:20:
if(preg_match_all(\'|page=([0-9]+)\">|si\',$file,$page)){
if($pg-1 == max($page[1])) {
$max = max($page[1])+1;
} else {
$max = max($page[1]);
}
echo $div_link . \'Страницы: \'.pages($pg,$max,\"&\" . $div_end;
}
та это обычная навигация..я подобное проворачивал, а вот чтоб каждую страницу инициализировало,это главная трабла, также регуляркой пробывал подменял адрес подключения в заивисимости от того чтоб в урле.. но та же трабла..
$id = $_GET[\'id\'];
$lol = curl_init(\'http://лол.com/page/\',$id);
str_replace(\'<a href=\"/page/\',\'<a href=\"?id=/page/\',$lol);
если правильно понял
[code]
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,\'http://лол.com/page/\'.$_SERVER[\'QUERY_STRING\']\');
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_TIMEOUT, 3);
$result = curl_exec($ch);
curl_close($ch);
str_replace(\'<a href=\"/page/\',\'<a href=\"\',$result);
[/code]
так у меня аналогичное! и оно не работает
А курл тут собственно при чем? Курл парсит страницу, далее обрабатывай регулярками либо специальными библиотеками.