Экспертная система Delphi.int.ru

Сообщество программистов
Общение, помощь, обмен опытом

Логин:
Пароль:
Регистрация | Забыли пароль?

Delphi.int.ru Expert

Другие разделы портала

Переход к вопросу:

#   

Статистика за сегодня:  


Лучшие эксперты

Подробнее »



Вопрос # 1 658

/ вопрос открыт /

Здравствуйте!
Подскажите пожалуйста, с помощью какого компонента можно делать следующее:
загружать контент веб-страниц и сохранять нужное.
Спасибо.

HotMan Вопрос ожидает решения (принимаются ответы, доступен мини-форум)

Вопрос задал: HotMan (статус: Посетитель)
Вопрос отправлен: 5 июня 2008, 07:11
Состояние вопроса: открыт, ответов: 1.

Ответ #1. Отвечает эксперт: min@y™

Года 3-4 назад я ради прикола написал оффлайн-браузер сайта udaff.com.
Поскольку страницы с этого сайта генерируются из базы по порядковому номеру, в программе есть возможность задать интервал страниц для скачивания, например, 60000...60100.
Эта программа работает примерно так:


  1. скачивает очередную страницу;
  2. ищет в ней пути к картинкам (если задана закачка с картинками);
  3. выкачивает эти картинки в общую подпапку, если эти картинки уже не были скачаны;
  4. меняет пути в закачанной странице на относительные и правильные;
  5. сохраняет саму страницу.


Для парсинга страниц использован класс THTMLParser. Он-то тебе и нужен для вычленения из кода страницы нужного куска контента. А вот загрузка страницы и картинок написана мной самостоятельно на основе функций стандартного модуля WinInet.pas, так что можешь воспользоваться моим загрузчиком.

Саму прогу я, конечно же, прицепляю к ответу. Правда там в исходниках есть ложка дёгтя: мало комментариев. Но, если что, спрашивай.
К ответу прикреплён файл. Загрузить » (срок хранения: 60 дней с момента отправки ответа)

Ответ отправил: min@y™ (статус: Доктор наук)
Время отправки: 5 июня 2008, 08:40
Оценка за ответ: 5


Мини-форум вопроса

Мини-форум пуст.

Чтобы оставлять сообщения в мини-форумах, Вы должны авторизироваться на сайте.

Версия движка: 2.6+ (26.01.2011)
Текущее время: 22 февраля 2025, 11:52
Выполнено за 0.03 сек.