• Członkowie 43 posty
    21 sierpnia 2022 15:53

    Cześć Pythonistas!

    Chciałem zapytać o legalność w Polsce (w polskim prawie) agregacji różnych treści (scraping danych z różnych stron) i wykorzystanie ich u siebie we własnym portalu -co wolno a czego nie wolno?

    W internecie zdania są bardzo podzielone, niemal każdy pisze co innego :)

    Ogólnie doszedłem do takich wniosków po przeczytaniu różnych informacji w wielu miejscach:
    - wolno scrapować co się chce, gdzie się chce i ile się chce (nawet jeśli strona zabrania tego i ma w regulaminie "zakaz scrapowania" - można to zupełnie olać!), natomiast
    danych tych nie można prezentować w tej samej formie (kopia 1:1) na swojej stronie (można je publikować dopiero w formie "przetworzonej" - tj. np. streszczenie tekstu).
    - w innym przypadku: wykorzystując dane (niemal) niezmienione podobno trzeba u siebie podać zródło - nazwę portalu i bezpośredni link - skąd te dane pozyskaliśmy.
    - nie wiem zupełnie jak jest ze zdjęciami - bardzo różne opinie (ale przecież ktoś te zdjęcia robił i jakieś prawa autorskie są "przypisane" do każdego zdjęcia?). Agregacja bez zdjęć zwykle nie ma dużego sensu ;)

    Znalazłem kilka polskich stron agregujących różne treści i są setki jeśli nie tysiące zagranicznych portali, które zbierają z innych dane z branżowych serwisów. Jest tego mnóstwo. Nie dawno wpadłem na AutoUncle - "moto wujek" całą Europę scrapuje :)

    Dziś przypadkiem znalazłem stronę AdRadar.pl która zbiera nieruchomości z prawie czterdziestu (!) portali.
    ( nawiasem mówiąc zagadką dla mnie jest jak ona działa - bo przy zmianie strony w paginatorze, strona wyświetla okienko, że dogrywa / ściąga kolejne oferty (???). Dziwne ).

    To ta strona: www.adradar.pl/ Mają oferty (opisy, ceny, historie ofert i nawet zdjęcia ofert ).

    Wiem, że jest nas na razie bardzo mało na forum, więc - rafalp i raydeal - nie kieruję tego pytania tylko do Was! Liczę, że za miesiąc czy dwa będzie tutaj więcej pythonistas :

    Dzięki za odpowiedzi!

    /pyczatkujacy

  • 27 sierpnia 2022 21:32

    Z jednej strony to są publicznie dostępne date które twórca innym udostępnił za pomocą internetu. Z drugiej mogą być one chronione prawem autorskim. Więc przetworzenie może być spoko (ale nie musi być). Zdjęć bym się nie tykał, tak samo jak tekstów. Ciągnięcie danych tabelkowych raczej powinno być spoko.

    AdRadar.pl może być dogadany z portalami ogłoszeniowymi, dlatego ciągną ogłoszenia z 40 portali. Albo te portale mają to gdzieś bo biorą $$$ za publikacje ogłoszenia i co dalej z ogłoszeniem się dzieje już ich nie interesuje.

  • Członkowie 43 posty
    19 września 2022 16:51

    Mission impossible ! :)

    W międzyczasie znalazłęm więcej stron podobnych do AdRadar.pl które również agregują treści i również powątpiewam by były "dogadane". Morizon.pl też scrapuje oferty, czytałem artykuł na ten temat.

    /pyczatkujacy