Импорт текста из интернет страницы в Excel
Описание функции
Речь в статье пойдет не о стандартной функции импорта страницы с помощью веб запроса, а об импорте отдельных частей страницы (например, только наименование товара или его стоимость, отдельный курс валюты или ставка по кредиту). Отличие функции от веб запроса в том, что извлекается не вся страница, а только нужная область и извлекается она не на отдельный лист, а в ту ячейку, которая будет указана.
В основном функция будет полезна для тех, кто массово собирает информацию с заданных интернет страниц (тек кто занимается так называемым парсингом сайтов).
Функция =ТЕКСТИЗURL(URL; ТЕГ_СТАРТ; ТЕГ_КОНЕЦ) имеет следующие аргументы:
- URL — адрес страницы интернет, на котором расположена необходимая для импорта информация
- ТЕГ_СТАРТ — Начало тега, внутри которого находится информация. Например, ‹div›импортируемый текст‹/div›
- ТЕГ_КОНЕЦ — Конец тега, в котором находится информация. Например, ‹div›импортируемый текст‹/div›
Что такое тег и где его искать?
Тег — это специальный текст html страницы, который заключен в угловые скобки (например, ‹title›). Теги служат для оформления и настройки интернет страницы. В теги заключают текст (содержимое) которые пользователи и видят на интернет странице. Как правило такое содержимое как цена, наименование товара, курсы валют или иные показатели заключаются в отдельные теги. Найти их можно отобразив html код интернет страницы, нажав сочетание клавиш Ctrl + U.
Для работы функции необходимо найти начальный тег и конечный тег. Как правило, теги парные и если начальный тег называется ‹title›, то конечный будет ‹/title›.
Пример
Извлекаем наименование товара и цену из интернет страницы в Excel
Импорт в EXCEL данных из интернета
history 9 апреля 2013 г.
- Группы статей
- Импорт данных
Выполним импорт курса валют с интернет-сайта без единой строчки кода.
Импорт курса валют на лист EXCEL, как и многих других данных (прогноз погоды, курс акций) из интернета, можно осуществить без единой строчки кода.
Выберите вкладку Данные , затем раздел Получить внешние данные , нажмите кнопку Из Веба . В открывшемся окне в адресную строку введите, например, ]]> www.yandex.ru ]]> .
После загрузки страницы, вы увидите черные стрелочки, в желтой рамке. Это означает, что такие данные могут быть импортированы. После нажатия на стрелку желтый фон окрасится в зеленый.
Нажмите на кнопку Импорт . Вскоре содержимое появится в ячейках. Для настройки параметров импорта данных нажмите Данные/ Подключения/ Свойства (должна быть выделена любая ячейка с импортированными данными).
Здесь также можно настроить периодичность и параметры обновления данных.