Как следить за индексацией страниц сайта

13 марта 2012 | Автор: zkzakhar | Теги: , ,

monitoring-linksМожет потому что я новичёк и более продвинутый народ в сие функционале не нуждается, но коль у меня возникла такая потребность значит надо что-то думать. Дело вот в чём. Каждый раз после того как Яндекс проводит свой АП выдачи я захожу в Я.Вебмастер и смотрю какие страницы попали в индекс, а какие слетели (увы, пока что бывает часто). Но как я это делаю: запоминаю (записываю) страницы до АПа и страницы после. А потом сравнивая их узнаю что мне надо.

Ну ладно, сейчас у меня около 20 страниц в индексе Яши, а что будет когда их прибавится? Скажем 100? Времени на такую ручную проверку уйдёт масса! И я подумал, а вдруг есть сервис, который позволяет ввести нужные тебе страницы в базу, а потом с каждым АПом наблюдать динамику: что упало, что прилетело. Что-то такое, что бы напоминало монитор позиций в Megaindex (рисунок)! Только вместо красненьких «-1» и зелёненьких «1» отображалось, например «вылетела» или «появилась» (речь о проиндексированной странице). Описал этот придуманный мною интерфейс грубо, но думаю суть понятна. И ещё что бы такой сервис был доступен в online режиме. Ведь наблюдение за индексацией страниц входит в перечень ответов на вопрос как раскрутить сайт самостоятельно.

Но увы, поискав по просторам как следить за индексацией страниц — ничего такого не нашел. Поспрашивал на форуме — толком никто ничего посоветовать не смог, но дали ссылку на прогу под виндузу YCCY, за что я очень благодарен. Я начал с ней работать — вроде всё классно, но после проверки индексации страниц я так и не смог сохранить результаты, что бы потом их сравнить с будущими результатами. При сохранении вот такие бакапористые вещи случаются. Не исключаю вариант что это только у меня, так как и кнопки типа «Перепроверить» и «Перепроверить и очистить поля» у меня тоже как-то совсем не так работают. Написал в саппорт, может чем помогут.

Но тем не менее решать проблему с поиском нужного функционала как-то надо. Сказано-сделано. Раз гора не идет к Магомету, значит Магомет идёт к горе. Я совместил несколько программ, ключевой из которых выступает именно YCCY. Теперь сам алгоритм от начала до конца:

Пункт 1. Для начала нам надо собрать урлы, которые мы хотим проиндексировать. Есть для этих целей хорошая программка. По этой ссылке _http://apocx.ru/baza-softa качаем STGrabber. Запускаем. Если движок сайта WordPress, то админ должен был поставить карту сайта xml-формата, находится по адресу _http://yousite.ru/sitemap.xml , поэтому в прожке выбираем вкладку «С файла Sitemap.xml» вводим урл так же, как показано на рисунке (без лишних слешев в конце). Запускаем.

По окончании парсинга жмём «Сохранить найденные ссылки» — именно они нам и нужны, без всяких html-тегов. Заходим в папку программы Save и в файле all.txt находится то что надо. Переходим на пункт 2.

Пункт 2. Файл all.txt обзываем как-то иначе, например all-yousite.txt, создаём отдельную папку и бросаем файл туда. Теперь о программе YCCY. Качаем эту штуку здесь _http://www.yccy.ru/soft/yccy, распаковываем и запускаем. Выбираем модуль «Indexator» и через верхний левый ярлычек с папкой выбираем наш all-yousite.txt. В левом большом окне появились наши урлы — всё ок, жмём «Начать проверку». Ждём окончания. В настройке интерфейса копаться не буду, думаю там всё понятно. Собираем результаты из поля «Есть в Яндексе» и сохраняем их в отдельный файл. Лучше всего его назвать текущей датой, например 13.03.12-yousite.txt. Всё, нам YCCY пока не нужен.

Пункт 3. Теперь намотаем немного времени и предположим, что уже 15.03.12, прошел АП выдачи Яши и из индекса 2 страницы вылетело и 5 новых залетело. Это мы узнали прогнав все урлы по YCCY, как описано в пункте 2. Сохранили текущие результаты в файл 15.03.12-yousite.txt и теперь… Теперь очень просто: нам надо сравнить два файла за 13 и за 15 число. Потратил я пару минут на поиск такой программки, но оказалось всё лежит под носом — Microsoft Word 2007 или 2010. «Рецензирование» — «Сравнить» и в эти два поля вставляем наши файлы.

compare

Можно убрать галочку из «Перемещения». Нажимаем ОК и смотрим: то, что у нас красное зачёркнутое — то вылетело, а просто красное — влетело.

Вот как-то так. Хотя для большого количества сайтов такой способ все равно требует затрат времени. Если вдруг всё же кто-то знает БЕСПЛАТНЫЙ сервис, который подходит под все описания первых двух обзацев — буду очень благодарен за помощь. Хотя кому денег не жалко на такие вещи могу дать урл на платного сервиса, вот он _http://www.seolib.ru/script/backauto или бесплатный вариант, но таких вещей в сети полно _http://www.seolib.ru/script/extlfree

Захар

[vk-share-button]