парсинг картинок из css

Тема в разделе "Скачивание картинок и файлов", создана пользователем eksin, 7 мар 2014.

  1. eksin

    eksin New Member Пользователи

    Регистрация:
    16 мар 2011
    Сообщения:
    10
    Добрый день.
    Подскажите пожалуйста , как спарсить картинки , если они грузятся через css , т.е. к примеру :

    на сайте вывод картинок такой :
    <p class="1"></p>
    <p class="2"></p>
    <p class="3"></p>

    а в стилях прописаны картинки:
    1 {background-image: url('/images/pushkin.jpg');}
    2 {background-image: url('/images/pushkin.jpg');}
    3 {background-image: url('/images/pushkin.jpg');}


    конкретно на примере: , алиекспресс - женские кошельки , картинки из описания товара т.е. все картинки между Product Description и Packaging Details парсятся нормально, а тоже самое в категории женские сумки уже не работает , парсер не может забрать картинки из стилей...
     
    Последнее редактирование: 7 мар 2014
  2. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Код:
    CSVIMAGE(код начала|код конца)
     
  3. eksin

    eksin New Member Пользователи

    Регистрация:
    16 мар 2011
    Сообщения:
    10
    а такой вариант не правильный что ли ? --> [CSVIMAGES(img)]

    просто такой вариант работает на всех остальных категориях , а именно в сумках не хочет...
     
  4. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    А вы видите в вашем коде тег img?
    Ссылки недоступны для гостей
     
  5. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пожалуйста =)
     
  6. eksin

    eksin New Member Пользователи

    Регистрация:
    16 мар 2011
    Сообщения:
    10
    Со стилями понятно...

    Но в моём случае надо видимо как-то по другому парсить , вот кусок кода , который отвечает за вывод изображений... подскажите плиз как вытащить оттуда картинки ? (_aliexpress.com/item/0050HOT-Free-Shipping-Black-Leather-Fashion-Luxury-Lady-Ladies-Women-s-Messenger-Bags-Woman-Shoulder-Handbag/1325271301.html)

    <div id="custom-description" class="ui-box ui-box-normal product-custom-desc">
    <h2 class="ui-box-title">Product Description</h2>
    <div class="ui-box-body">
    <div class="loading32 desc-loading"></div>

    </div>
    </div>
     
  7. Kreol

    Kreol Модератор Команда форума Модератор

    Регистрация:
    6 янв 2013
    Сообщения:
    2.666
    Простите, но где Вы тут видите изображения?
     
  8. eksin

    eksin New Member Пользователи

    Регистрация:
    16 мар 2011
    Сообщения:
    10
    Извините , а чем же и где они выводятся ?
     
  9. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    В том коде, что вы показали никаких картинок нет! =) Ищите, где они есть...
     
  10. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Вот вам выдержка из кода страницы с товаром:
    bigpic - говорит само за себя =)
     
  11. eksin

    eksin New Member Пользователи

    Регистрация:
    16 мар 2011
    Сообщения:
    10
    2root. Сорри , но не эти мне картинки нужны... это картинки или где "цвета" или альтернативные , под основным изображением... А я пытаюсь спарсить изображения из описания товара, т.е. которые между полями Product Description и Packaging Details


    Кстати странно , но по одной ссылке на товар , два не совсем одинаковых кода страницы... в одном получается нету картинок этих , а в другом есть и теги и ссылки на картинки , но этот код из CD не видно...
    Ссылки недоступны для гостей
     
  12. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Это происходит потому, что контент с картинками подгружается скриптами при выполнении страницы.

    Вот вам трудоемкий в реализации способ быстрого парсинга этого подгружаемого контента - Ссылки недоступны для гостей (что, конечно же, давно висит в справке).

    Если хотите быстро, грубо и в лоб решить этот вопрос (но парсить будет медленно, 1 товар за 5 секунд примерно и в 1 поток!), то нажмите ctrl+h и включите Internet Explorer (DOM) для "контент". Чтобы и без того медленный сайт успел отдать вам этот контент, поставьте значение "тайм-аут проверки загрузки WEB-документа (МС)" равным 3333

    Надеюсь, вопрос будет решен. Спасибо! Ждем вас снова =)
     
  13. eksin

    eksin New Member Пользователи

    Регистрация:
    16 мар 2011
    Сообщения:
    10
    2root , я видео это видел... но как применить его так и не понял , там порядка 200 запросов фигачит в этом алиэкспрессе... и один видимо черт разберётся что и куда... зато нашел , что нужные фотки находятся в подпапке ibank ( зато урл у фоток вообще не понятно как формируется)... и ещё если отключить выполнения js на странице , то фотки не загружаются которые нужны мне... видимо надо смотреть все js скрипты там , правильно же ?

    1 поток с задержками и дум-ом на контент ставил в своём задании где вывод картинок через [CSVIMAGES(img)] (он вообще из 10 строк для парсинга, парсить стал 1-2)



    зы. неужели никто эти сумки чертовы не парсил ?
     
    Последнее редактирование: 8 мар 2014
  14. Root

    Root Администратор Администратор

    Регистрация:
    10 мар 2010
    Сообщения:
    14.818
    Город:
    Барнаул
    Пути решения я вам сказал. Советую ими воспользоваться.
     

Поделиться этой страницей