Парсинг Wordstat Yandex в КейКоллекторе

Ошибка «не удалось распознать формат ответа Яндекс.Wordstat. Выполним повторную попытку сбора» означает что аккаунт был закапчеван Яндекс капчей по типу Я не робот, данную капчу КейКоллектор решать сейчас не умеет. Для решения данной проблемы можно воспользоваться одним из ниже перечисленным способом.


————————————————————————————————

Если у вас нет Яндекс аккаунтов которые проходят проверку, можете воспользоваться услугой создания подтвержденных по СМС Яндекс аккаунтов через купленные (не только у нас) прокси для КейКоллектора, стоимость 1 аккаунта 80 руб. В итоге будут выданы данные в формате КейКоллектора, которые необходимо будет просто вставить в Настройки — Yandex — Аккаунты. К этим аккаунтам Яндекс относится лучше, т.к. IP регистрации аккаунтов будет такой же как и IP прокси.

Так же мы занимаемся продажей прокси: 5 прокси — 500 руб., 10 прокси — 910 руб. Информация по услуге.

Всем покупателям проксей бесплатно предоставляется наш сервис распознавания капч (антикача сервис, выдается URL:Port и API key, т.е. Токен). А также наш парсер фраз всей левой колонки Яндекс.Wordstat (максимум 41 страница) сразу с частотностями.

Обращаться по контактам: Skype: bvolodya-74 Telegram: @Vladimir_AWM (ВНИМАНИЕ, аккаунты Vladimir_AWM24_7 и Vladimir_AWMj — фейки!)


1 ВАРИАНТ парсинга Вордстата через XML

На данный момент парсить левую колонку Яндекс.Wordstat можно через платный сервис XMLRiver. Видео как работать через XMLRiver — Смотреть и тут.

Расширенную частотность Яндекс.Wordstat можно собирать так же через XMLRiver или же через Яндекс.Директ в безбраузерном режиме. КейКоллектор умеет в нем авторизовываться и разгадывать капчу (через сервис антикапчи RuCaptcha) в автоматическом режиме. Как собирать частотку через Директ.


2 ВАРИАНТ парсинга Вордстата, напрямую с Вордстата

За место XMLRiver можно воспользоваться нашим скриптом (файл Readme), который всем покупателям наших прокси предоставляется бесплатно так же как и сервис антикапчи (выдается URL и Токен). Данный скрипт (написанный под Browser Automation Studio) парсит всю левую (максимум 41 страницу) и правую колонки Яндекс.Wordstat сразу с частотностями. Также умеет парсить цифру «Что искали со словом «слово» — XXXXXX показов в месяц». Разгадывать автоматически капчу Яндекса.

Расширенную частотность Яндекс.Wordstat можно собирать через сам КейКоллектор, через Яндекс.Директ в безбраузерном режиме как собрать?.

Смотреть демо видео работы парсера. Разумеется для работы необходимы прокси и Яндекс аккаунты, которые беспрепятственно авторизуются через эти прокси (их можно приобрести у нас). Скорость парсинга 1 страницы вордсата через 1 аккаунт/прокси (поток) составляет около 13 секунд. Что при использовании например 13 аккаунтов/прокси (потоков) скорость парсинга 1 страницы составит около 1 секунды.

Общие правила:

Количество потоков равно количеству аккаунтов/прокси.

Везде задержка между запросами — Нормальный режим.

Яндекс аккаунты необходимо создавать через прокси (например с использованием плагина SimpleProxy или Proxy Switcher and Manager) в режиме Инкогнито (Ctrl + Shift + N), с сохранением привязки аккаунт/прокси для их последующей вставки в КейКоллектор. Яндекс аккаунты регистрируются только с подтверждением по СМС (можно использовать сервис Vak-SMS.com).


————————————————————————————————

ВСЕ ЧТО ОПИСАНО НИЖЕ ВРЕМЕННО НЕ АКТУАЛЬНО!!!

————————————————————————————————

На данный момент 100% работает ВТОРОЙ вариант (браузерный режим). В связи с обменом Яндексом домена yandex.ru со ВКонтакте (13 сентября), данный способ перестал работать!

На данный момент 100% работает ПЕРВЫЙ вариант (безбраузерный режим) с подстановкой кукой fuid01, но только в 2 потока!

Первый вариант — безбраузерный режим (РАБОТАЕТ ТОЛЬКО ДЛЯ 2 ПОТОКОВ)

В настройках Кейколлектора — Yandex — Аккаунты необходимо добавить куку fuid01 от своего любого Яндекс аккаунта.

Добавление куки fuid01 в КейКоллектор

Что бы ее получить необходимо авторизоваться в любом своем Яндекс аккаунте через Google Chrome. Перейти по ссылке https://wordstat.yandex.ru и ввести любой запрос, далее перейти на https://yandex.ru/internet и поиском по странице (Ctrl+F) найти куку fuid01. Если данной куки нет, попробуйте в другом браузере или на другой машине. Данная кука выдавалась Яндексом через Flash Player, который перестал поддерживаться и был отключен с 2021 года. Т.е. данную куку можно найти в браузере если ОС долго не переустанавливалась и куки не чистились в браузере с 2020 года.

Далее вставить полученную кук в настройки — fuid01=полученная_кука (без пробелов) и перезапустить КейКоллектор.

Второй вариант — браузерный режим с ручным распознаванием капчи Яндекса. (ПЕРЕСТАЛ РАБОТАТЬ с 13 сентября)

Тест при работе в Браузерном режиме 7 июля 2022 года:
https://t.me/KeyCollectorCHAT/18421
https://t.me/KeyCollectorCHAT/18457

Сначала необходимо очистить кэш и куки. И добиться что бы все аккаунты авторизовались (для перезапуска окон браузеров можно парсинг ставить на паузу и запускать снова).

Очистка кук и кэша

В настройках Кейколлектора — Yandex — Yandex.Wordstat установить Обработчик — браузерный и установить галочку — Использовать режим отладки. Если была прописана кука fuid01, ее необходимо удалить из настроек. Перезапустить Кейколлектор.

Использование браузерного режима в КейКоллекторе

Когда появляется ошибка (не удалось распознать формат ответа Яндекс.Wordstat. Выполним повторную попытку сбора), это означает что аккаунт залетел на капчу, необходимо в окнах браузеров КейКоллектора вписать в поисковую строку Яндекса любой ВЧ поисковый запрос (например «купить», «продать» и т.д.) и быстро проходить постранично вглубь выдачи, должна появиться капча, которую нужно решить.

Если при переходе до 20 страницы капча не появилась, значит данный акк не под капчей.

После проверки таким способом всех акков и решения капчи на Яндекс аккаунтах, необходимо проект поставить на паузу, и продолжить парсинг.

Со временем, после прохождения вручную капч, аккаунты становятся более трастовыми и капчи появляются реже.

СМОТРЕТЬ ВИДЕО ПРОВОЦИРОВАНИЯ И ПРОХОЖДЕНИЯ КАПЧИ В БРАУЗЕРАХ КЕЙКОЛЛЕКТОРА

FAQ

В: Банит ли Яндекс аккаунты?

О: Яндекс аккаунты не банит. Проблема может быть с прокси. После прохождения вручную новой Яндекс капчи (через браузерный режим) и перезапуска парсинга, ошибка «не удалось распознать формат ответа Яндекс.Wordstat. Выполним повторную попытку сбора» появляется спустя 3 минуты.

В: В чем преимущество заказа аккаунтов у нас?

О: Яндекс аккаунты создаются вручную в браузере через прокси, с которыми будут работать в КейКоллеторе. Они будут сразу проходить проверку (Настройки — Yandex — Аккаунты). Создаются с СМС подтверждение. Выдаются готовые данные в формате КейКоллектора.

В: Могу ли я сам создать такие аккаунты?

О: Да. Используйте при создании в браузере режим Инкогнито. Управлять прокси в Google Chrome удобно через плагин SimpleProxy. СМС можно получить в сервисе vak-sms. Не забывайте сохранять пары прокси — логин аккаунта, пароль аккаунты, номер телефона.

В: После прохождения Яндек капчи и перезапуска парсинга, через пару страниц капча появляется снова

О: Проблема с прокси. Их необходимо заменить.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *