The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]




Версия для распечатки Пред. тема | След. тема
Новые ответы [ Отслеживать ]
Защита web-сервера от парсинга, !*! deatwisedog, 07-Июл-16, 11:55  [смотреть все]
Добрый день, коллеги!
Перешел на новый проект и появилась новая для меня задача.

Дано: VDS с Centos 6 на борту.
Развёрнут сайт на очень сильно перепиленном  bitrix.
Нужно защитить контент (Которого много и он уникальный) от парсинга/краулинга/скреппинга (Называйте как хотите).

1) Можно ли натравить на отслеживание парсинга fail2ban? Может есть готовый мануал? Сейчас он отслеживает только попытки брутфорса ssh.

2) Есть ли какие-то специализированные решения для bitrix?

3) Как вообще можно отследить парсинг? При условии, что парсер использует, скажем 10/100/1000 геораспределенных прокси?

ПыСы: Чувствую, что решение будет в чём-то схоже с защитой от DDoS, но обосновать не могу.

  • Защита web-сервера от парсинга, !*! _, 18:10 , 07-Июл-16 (1)
    > Нужно защитить контент (Которого много и он уникальный) от парсинга/краулинга/скреппинга
    > (Называйте как хотите).

    Назовём это тупостью и жадностью. Ибо это оно и есть.
    Расскжи начальству что есть много компаний которые ежемесячно платят CDN-ам за доставку "контента (Которого много и он уникальный)" суммы в миллион раз превышающие стоимость вашей лавки :)

    > ПыСы: Чувствую, что решение будет в чём-то схоже с защитой от DDoS, но обосновать не могу.

    Прикрутите рэйт-лимиты, но оно тоже не сильно поможет, а клиенты будут недовольны.

  • Защита web-сервера от парсинга, !*! Павел Самсонов, 11:55 , 08-Июл-16 (2)
    >[оверквотинг удален]
    > Развёрнут сайт на очень сильно перепиленном  bitrix.
    > Нужно защитить контент (Которого много и он уникальный) от парсинга/краулинга/скреппинга
    > (Называйте как хотите).
    > 1) Можно ли натравить на отслеживание парсинга fail2ban? Может есть готовый мануал?
    > Сейчас он отслеживает только попытки брутфорса ssh.
    > 2) Есть ли какие-то специализированные решения для bitrix?
    > 3) Как вообще можно отследить парсинг? При условии, что парсер использует, скажем
    > 10/100/1000 геораспределенных прокси?
    > ПыСы: Чувствую, что решение будет в чём-то схоже с защитой от DDoS,
    > но обосновать не могу.

    Контент защищается паролем. Рассмотри возможность авторизации на сайте.

    • Защита web-сервера от парсинга, !*! deatwisedog, 12:31 , 08-Июл-16 (3)
      Пароль - не вариант, это каталог. Вопрос именно в том, как защитить работу фотографа/дизайнера/копирайтера и прочих. Само собой, стопроцентной защиты не будет никогда, но нужно осложнить парсинг ровно настолько, чтобы он стал просто нецелесообразным

      • Защита web-сервера от парсинга, !*! fail, 14:57 , 08-Июл-16 (5)
        > Пароль - не вариант, это каталог. Вопрос именно в том, как защитить
        > работу фотографа/дизайнера/копирайтера и прочих. Само собой, стопроцентной защиты не
        > будет никогда, но нужно осложнить парсинг ровно настолько, чтобы он стал
        > просто нецелесообразным

        - js, с сеансовыми токенами(и подобное)
        - на графику можно прикрутить "водяные знаки"

  • Защита web-сервера от парсинга, !*! keir, 14:32 , 08-Июл-16 (4) +1
    1. То, что попало в интернет - навсегда останется в интернете.
    2. Защитить сайт от парсинга - невозможно. Любой сайт для парсера - html код, а он очень хорошо структурирован и парсить его нет проблем. Можно придумать разные извращения, но их изобретательство встанет вам в разы дороже чем возможные потенциальные убытки.
    3. Раз у вас каталог с графическим материалом, его можно защищать водяными знаками или не выкладывать полные оригиналы (Делать обрезку обрамления и хранить оригинал в недоступном никому месте. В дальнейшем это даст выиграть в суде борьбу за авторство).
    4. см. пункт 1.



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру