Собираюсь написать граббер для загрузки в Эксклюзив, ибо там всё паблик, почти ниче своего. Заказывайте, кому что, под что, и откуда надо.
По большинству пожеланий напишу.
(Думал написать граб \"куски кода\" с профи, но потом решил- для народа всё таки, пусть сами и решают.
И какой минимальный рейт тогда выставлять?
Грабберы - зло! Контент должен быть свой, ну или \"почти\" свой Сейчас ПС даже дубли изображений определяют. Парсер пиши
Во-первых: граббер и парсер- Это одно и то же!
Во-вторых: если парсить с закрытых для поиска сайтов, как например с профи- для поисковиков эт будет уникальный контент!
Ну может не граб, а мод какой-то нужен? Или дизайн?
Да уж, блин, нашел, что спросить у людей в три часа ночи
В моем понимании, которое сложилось исходя из разбора разного рода скриптов, граббер в реалиях wap - это одностраничник, который копирует чужой сайт, иногда даже выкачивая чужие файлы к себе на сервер.
Парсер - копирует любого рода информацию на свой сервер/бд и используется только для обновления контента своего сайта. Чтобы контент был уникальным можно прикрутить тот же синонимайзер или самому рерайтить текст. Но опять же, в реалиях wap, где в основной контент приложения и музыка - это не понадобится.
А основная разница в том, что если сайт-донор решит защититься от воровства контента, то парсер просто перестанет работать, а граббер может послать наш дрогоценный трафик на разного-рода шлак, в том числе, на фишинговые сайты, что повлечет собой вылет из ПС.
Вот как-то так.
~AL~, если пропишу, чтобы сохранять- то тогда ладно- граббер становится парсером но как же тогда дубли? Да и если кому-то раздел загрузок нужен- ну кто ж сохранять будет?
~AL~, И вообще- ну ты загнул
\"граббер может послать наш
дрогоценный трафик на разного-рода шлак\"
Ухахаха, сайт меня никуда не отправит, а если влепит рекламу- то ее можно буквально одним str_replace вычистить. а если ты думаешь, что будет редиректить на шлак? Если начнет редиректить- то и сам донор будет редиректить. И то- если не соответствует фильтру- то просто перестанет показывать страницу
SV, да ладно.. на один мой сайт как-то написали граб. Он стоял на сайте, где было 40 или 50к хостов. Несколько дней этот сайт дарил мне по 2-4к хостов в сутки бесплатно, скорее всего я даже заработал на этом тысячу-две рублей (мелочь, а приятно).
При этом тех, кто пришел с граба - редиректило, а мои посетители спокойно пользовались сайтом. И никакой str_replace тут бы не помог.
Я бы мог рассказать и об еще более хитрых случаях защиты от граббинга.
~AL~, еще в вапе весьма часто граб работает по схеме \"вырежем ненужное - покажем остальное\" (что, как мне кажется, не очень правильно). Парсеры обычно действуют иначе - \"просто возьмем нужное, не обращая внимания на остальное\". Хотя, может, это только мои личные пристрастия.