Автор Crawler Tool

  1. Отчет об одном URL
  2. Отчет по нескольким URL
  3. Начальная настройка
  4. конфигурация
  5. Запуск инструмента (версия с одним URL)
  6. Запуск инструмента (версия с несколькими URL)
  7. Установка PHP на Windows
  8. Предостережения

AuthorCrawler - это инструмент для проверки концепции , который я разработал, чтобы выделить способы, с помощью которых сообщество SEO может использовать разметку авторства Google для сбора данных о ссылках.

Инструмент анализирует обратные ссылки на URL-адреса и сканирует их в поисках разметки авторства, которая будет использоваться для загрузки обширной информации об авторе этих ссылок. Он использует SEOmoz API для ссылок, а затем сканирует их каждый.

В итоге вы получите отчет, который позволит вам отсортировать обратные ссылки по социальному статусу авторов этих ссылок. Увидеть пример отчетов чтобы увидеть, как это может выглядеть.


Скачать AuthorCrawler

Отчет об одном URL

(пример отчета для одного URL)

Отчеты с одним URL анализируют обратные ссылки на указанный URL / домен. Узнайте, кто ссылается на ваш сайт, и где еще они пишут.

Отчет по нескольким URL

(пример отчета для нескольких URL)

Mutliple URL-отчеты анализируют обратные ссылки на несколько доменов и делают «пересечение авторов», чтобы найти авторов, которые ссылаются на ваших конкурентов, но не на вас.

Начальная настройка

Этот инструмент написан на PHP, поэтому его можно изменить для запуска через веб-браузер (для всех, кто готов принять вызов), но в настоящее время он предназначен для командной строки. Я протестировал его на Mac OS X и Windows, он также должен нормально работать на Linux.

Существует две версии инструмента: одна для запуска отчета по одному URL-адресу, для получения созданных обратных ссылок, а вторая - для просмотра нескольких URL-адресов и для пересечения автора.

Обе версии нуждаются в ключах API для API SEOmoz (это бесплатно!) И ключа API Google (это бесплатно!).

Ключ API Google+: https://code.google.com/apis/console/ (включите Google+, подождите пару минут)

Ключ API Moz: http://www.seomoz.org/api/keys

Я рекомендую запускать этот инструмент из облачной службы (в рамках ваших Условий и положений!), Такой как Amazon Web Services или Rackspace Cloud Hosting, или с имеющегося у вас сервера. Вы можете раскрутить экземпляр облака только тогда, когда вам понадобится запустить инструмент, и, возможно, вам понадобится менее $ 0,25, чтобы запустить его несколько раз.

конфигурация

Во-первых, поместите оба ваших ключа API в соответствующие места в файле config.php.

  • Ограничение обратных ссылок. Параметр $ backlink_limit указывает максимальное количество обратных ссылок (на URL в многоверсионной версии инструмента) для извлечения из API SEOmoz. Если у вас возникли проблемы по какой-то причине, вы можете уменьшить это, но я в основном оставил его в диапазоне 250-1000 в зависимости от того, что я делал.
  • No Follows: $ get_no_follow указывает, хотите ли вы, чтобы обратные ссылки не включали никаких последующих ссылок.
  • Домен. Параметр $ domain_links устанавливает, хотите ли вы получать обратные ссылки на определенный URL-адрес или на весь домен.

Запуск инструмента (версия с одним URL)

Запустить единственную версию инструмента из командной строки легко:

php single.php www.tomanthony.co.uk

Инструмент должен немедленно запуститься, вы должны увидеть результат вроде:

Когда инструмент завершит работу, вы получите список авторов и их данные, а также список созданных URL-адресов. Однако важной частью является:

Написание отчета report_2012-03-30-08-22-26.html

Это дает вам название отчета в формате HTML, который вы теперь можете открыть и поиграть. :)

Запуск инструмента (версия с несколькими URL)

Это ничем не отличается от единственной версии, просто вы добавили несколько ссылок:

php multip.php www.mysite.com www.competitor1.com www.competitor2.com

Вы получите аналогичный вывод, а также получите имя отчета в формате HTML для просмотра / публикации.

Установка PHP на Windows

Загрузите PHP 5.3 (многопоточная версия) отсюда:

http://windows.php.net/download/

Выберите опцию «не настраивать сервер» и дайте ему установить.

Тогда вам нужно добавить это:

C: \ Program Files \ PHP \

в переменную PATH Windows (см. Вот для инструкций).

Затем запустите его из командной строки в соответствии с инструкциями выше.

Предостережения

Инструмент не идеален, несколько замечаний:

  • Он не может обнаружить авторство, которое использует «автор Тома Энтони» со связанным методом адреса электронной почты для авторства. Тем не менее, я на самом деле не видел, чтобы кто-то действительно использовал этот формат, но представьте, что есть люди. Не уверен, как решить эту проблему.
  • URL-адреса профиля Google старого стиля, которые были настроены с использованием текстового имени (а не номера), в настоящее время не обнаруживаются. Я постараюсь добавить это до окончательного релиза - просто нужно выполнить редирект 301, чтобы получить идентификатор номера профиля.
  • Он может подбирать ссылки, которые отсутствуют в «авторском контенте» (т. Е. Ссылка в нижнем колонтитуле или ссылка на комментарий в блоге). Это можно было бы догадаться (с некоторой работой), но не планируется на ближайшем горизонте, так как это имеет тенденцию быть заглушенным другими факторами в игре, в настоящее время.