Импорт текста из интернет страницы в Excel
Описание функции
Речь в статье пойдет не о стандартной функции импорта страницы с помощью веб запроса, а об импорте отдельных частей страницы (например, только наименование товара или его стоимость, отдельный курс валюты или ставка по кредиту). Отличие функции от веб запроса в том, что извлекается не вся страница, а только нужная область и извлекается она не на отдельный лист, а в ту ячейку, которая будет указана.
В основном функция будет полезна для тех, кто массово собирает информацию с заданных интернет страниц (тек кто занимается так называемым парсингом сайтов).
Функция =ТЕКСТИЗURL(URL; ТЕГ_СТАРТ; ТЕГ_КОНЕЦ) имеет следующие аргументы:
- URL — адрес страницы интернет, на котором расположена необходимая для импорта информация
- ТЕГ_СТАРТ — Начало тега, внутри которого находится информация. Например, ‹div›импортируемый текст‹/div›
- ТЕГ_КОНЕЦ — Конец тега, в котором находится информация. Например, ‹div›импортируемый текст‹/div›
Что такое тег и где его искать?
Тег — это специальный текст html страницы, который заключен в угловые скобки (например, ‹title›). Теги служат для оформления и настройки интернет страницы. В теги заключают текст (содержимое) которые пользователи и видят на интернет странице. Как правило такое содержимое как цена, наименование товара, курсы валют или иные показатели заключаются в отдельные теги. Найти их можно отобразив html код интернет страницы, нажав сочетание клавиш Ctrl + U.
Для работы функции необходимо найти начальный тег и конечный тег. Как правило, теги парные и если начальный тег называется ‹title›, то конечный будет ‹/title›.
Пример
Извлекаем наименование товара и цену из интернет страницы в Excel
Как переносить табличные данные с сайта в «Excel». Порядок действий для импорта таблицы из интернет-сайта
Как переносить табличные данные с сайта в «Excel».
Если вы обладаете достаточным количеством времени и ресурсов перенести данные с сайта в таблицу «Excel» можно в «ручном режиме». Тот случай, когда таблица на сайте выделяется курсором мыши, копируется и вставляется в файл «Эксель». Естественно, этот способ долог и неудобен.
Я хочу рассказать Вам о другом, автоматизированном способе переноса данных с сайта в программу «Excel». Этот способ позволяет настроить процесс импорта обновленных актуальных данных с сайта прямо в таблицу одним нажатием кнопки мыши.
Для автоматизации импорта данных в «Эксель» из интернета потребуется «Excel» версии 2013 и выше, а так же надстройка Power Query.
Последовательность настройки скачивания данных:
Порядок действий для импорта таблицы из интернет-сайта в таблицу Excel.
- Шаг 1. Скопировать ссылку на страницу сайта, с которой планируете импортировать таблицу . Например: http://ruexcel.ru/zavisimost/ .
- Шаг 2. Перейти во вкладку Power Query .
- Шаг 3. В группе «Получение внешних данных» кликнуть по иконке «Из интернета»
- Шаг 4. В появившемся окне вставить в пустое поле, скопированный в шаге № 1 URL-адрес и нажать «Ок»
Программа Excel соединится с сайтом, обнаружит все опубликованные на странице сайта таблицы и предложит Вам выбрать, какую таблицу загрузить с сайта в Ваш документ Excel.
- Шаг 5. Выбрать нужную таблицу из предложенного списка и нажать «Правка» или «Загрузить»
Если нажать «Загрузить», таблица будет импортирована целиком. В режиме правки можно редактировать вид загружаемой таблицы, выбирать нужные столбцы и т.д.
Результат скачивания таблицы в Excel