|
Вопрос # 1 658/ вопрос открыт / |
|
Здравствуйте!
Подскажите пожалуйста, с помощью какого компонента можно делать следующее:
загружать контент веб-страниц и сохранять нужное.
Спасибо.
 |
Вопрос задал: HotMan (статус: Посетитель)
Вопрос отправлен: 5 июня 2008, 07:11
Состояние вопроса: открыт, ответов: 1.
|
Ответ #1. Отвечает эксперт: min@y™
Года 3-4 назад я ради прикола написал оффлайн-браузер сайта udaff.com.
Поскольку страницы с этого сайта генерируются из базы по порядковому номеру, в программе есть возможность задать интервал страниц для скачивания, например, 60000...60100.
Эта программа работает примерно так:
- скачивает очередную страницу;
- ищет в ней пути к картинкам (если задана закачка с картинками);
- выкачивает эти картинки в общую подпапку, если эти картинки уже не были скачаны;
- меняет пути в закачанной странице на относительные и правильные;
- сохраняет саму страницу.
Для парсинга страниц использован класс THTMLParser. Он-то тебе и нужен для вычленения из кода страницы нужного куска контента. А вот загрузка страницы и картинок написана мной самостоятельно на основе функций стандартного модуля WinInet.pas, так что можешь воспользоваться моим загрузчиком.
Саму прогу я, конечно же, прицепляю к ответу. Правда там в исходниках есть ложка дёгтя: мало комментариев. Но, если что, спрашивай. К ответу прикреплён файл. Загрузить » (срок хранения: 60 дней с момента отправки ответа)
 |
Ответ отправил: min@y™ (статус: Доктор наук)
Время отправки: 5 июня 2008, 08:40
Оценка за ответ: 5
|
Мини-форум вопроса
Мини-форум пуст.
Чтобы оставлять сообщения в мини-форумах, Вы должны авторизироваться на сайте.
|