Что такое дублированный контент, как его обнаружить и исправить?

  1. Что такое дублированный контент?
  2. Можно ли оштрафовать за дублированный контент?
  3. Почему дубликаты контента так негативны для моего сайта?
  4. ► Низкокачественный контент
  5. ► Снижение органической видимости
  6. ► Снижение конверсий
  7. ► Неправильная атрибуция авторства
  8. ► Потеря власти
  9. ► Проблемы в индексации
  10. 10 инструментов, чтобы узнать, есть ли у меня дублированный контент на моем сайте
  11. 1. Консоль поиска Google
  12. 2. SEMrush
  13. 3. Кричащая лягушка
  14. 4. Google Analytics
  15. 5. Плагиат
  16. 6. Кветекст
  17. 8. Команда «site:» + «Ключевое слово» в Google
  18. 9. Инструменты Virante
  19. 10. SiteLiner
  20. Как я могу удалить дублированный контент в моем блоге или на сайте?
  21. Наиболее распространенные способы устранения дубликатов на нашем сайте:
  22. 2. Сделать «Каноник»
  23. 3. Перенаправление 301
  24. 4. Robots.txt
  25. 4. Использование параметров URL
  26. 5. Единственный редактор
  27. Как решить дублирование контента, когда вы находитесь вдали от вашего сайта?
  28. 1-й вариант: просьба исключить
  29. 2-й вариант: каноническая ссылка
  30. 4-й вариант: обычное правосудие
  31. выводы
  32. А вы, вы когда-либо обнаружили дублированный контент в вашем домене или за его пределами? Какой инструмент...

Дублированный контент, без сомнения, может взвесить SEO-позиционирование нашего веб-сайта или электронной коммерции

Дублированный контент, без сомнения, может взвесить SEO-позиционирование нашего веб-сайта или электронной коммерции. И, несмотря на это, это одна из наименее оптимизированных ошибок или учитывается большинством из нас.

В настоящее время эта проблема является достаточной причиной для того, чтобы многие страницы вашего сайта, возможно, те, которые вы уже имели умеренно расположенные, в конечном итоге исчезнут из верхней части поисковых запросов.

Почему? Просто, потому что, если мы примем во внимание, что Google постоянно отлаживает SERP, чтобы показать результаты, которые всегда более качественны и актуальны для своих пользователей, мы не должны удивляться, что содержание дубликат плохо виден им.

Случай для вас, в одном из ваших поисков вы хотели бы буквально найти один и тот же текст и информацию почти в каждом результате первых страниц Google.

Я представляю себе «нет». Эта ситуация вас не устраивает, и я не думаю, что кому-то это нравится. Но, к счастью, это было добровольно или невольно, у этих ошибок есть решение.

В этой статье мы узнаем, как обнаружить дублирующийся контент (благодаря некоторым инструментам SEO, которые я использую), и научимся предлагать наиболее эффективные решения в каждом конкретном случае. Но сначала, как я обычно делаю во всех своих руководствах и уроках, я хотел бы сначала поставить вас в положение и дать вам определение темы, которая касается нас сегодня.

Меню тематического контента

Что такое дублированный контент?

Дублированный контент в SEO возникает, когда текст частично или полностью реплицируется в разных URL-адресах, будь то на страницах в одном домене (внутренний) или на страницах других веб-сайтов (внешний).

Кроме того, эта проблема также может возникнуть, потому что 2 или более URL ведут на одну и ту же страницу в вашем веб-домене.

В большинстве случаев внешние реплики происходят из-за стороннего копирования или плагиата. Напротив, внутреннее дублирование обычно происходит из-за ошибок в веб-структуре нашего сайта, и они приводят к тому, что несколько URL ведут на одну и ту же страницу, или потому, что мы использовали большую часть текста в описании 2 или более страниц.

Предполагается, что контент можно рассматривать как дубликат, когда более 30% его уже буквально опубликовано в других URL-адресах.

В обратном смысле это можно считать оригинальным, когда, по крайней мере, 70% текста, содержащего страницу, не имеет структуры, буквально идентичной структуре других.

Можно ли оштрафовать за дублированный контент?

По моему опыту, как дублирование контента, так и каннибализация ключевых слов, в большинстве случаев вместо того, чтобы давать нам простое и простое наказание, сводятся к снижению качества наших страниц, обращенных к Google, и, следовательно, у них большая потеря позиций в поисковой выдаче.

Конечно, если у вас есть веб-сайт, который постоянно злоупотребляет этими методами, он, скорее всего, будет оштрафован Panda (алгоритм Google для контроля над этими проблемами).

В любом случае, оштрафуйте или нет, вам должно быть ясно, что поисковые системы не обращают внимания на эти вещи. Кроме того, большой прогресс в их алгоритмах позволяет им легче обнаруживать эти копии текстов (особенно в пределах одной и той же сети).

Почему дубликаты контента так негативны для моего сайта?

Принимая во внимание, что вы уже знаете о чем мы говорим и что я имею в виду под этой общей проблемой SEO, вы должны знать, что некоторые из последствий, которые могут вызвать вас, следующие:

► Низкокачественный контент

Эта проблема может снизить качество ваших страниц для пользователей и Google.

Это означает, что тот, который выбирает Google, может быть не тем, который вам нужен, и, как следствие этого, вы можете показать пользователям «копию» с более низким качеством, и это будет хуже.

► Снижение органической видимости

Короче говоря, если вы теряете качество, вы также теряете позиции со своими страницами. И это падение результатов поисковой выдачи приводит к снижению вашей онлайн-видимости и трафика с поисковых систем.

► Снижение конверсий

Если у вас есть разные страницы с очень похожим текстом, поисковая система должна выбрать наиболее оптимальную страницу для этого поискового намерения.

Выбранным может быть тот, который не самый удобный для стратегии вашего бизнеса.

► Неправильная атрибуция авторства

Когда он обнаруживает два одинаковых URL в разных доменах, поисковая система выбирает исходную версию на основе даты индексации и / или популярности сайта.

То есть Google может ошибочно решить, какой оригинал, и, особенно если у вас мало полномочий в Интернете, наказать неверный веб-сайт.

Если вы всегда действуете с профессионализмом и генерируете свои собственные тексты, я понимаю, что это вызывает, по крайней мере, возмущение.

Вот почему так важно следить за Интернетом с определенной частотой, выявлять копии вашего оригинального контента, так как вредный может несправедливо стать вами.

► Потеря власти

Как и при каннибализации, дубликаты страниц могут сделать ваш сайт менее мощным.

Но кроме того, полученные вами ссылки могут указывать на разные URL-адреса для одной и той же темы, и вместо того, чтобы добавлять силы для улучшения своего позиционирования, вы делите полученные ссылки.

► Проблемы в индексации

Это может повлиять на индексацию страниц, потому что поисковая система отслеживает их все в течение определенного времени ( Бюджет сканирования ).

Потеря времени в этом отслеживании из-за избытка некачественных страниц или дубликатов заставит поисковую систему покинуть часть вашего сайта без посещения.

»Вас также может заинтересовать: Что такое алгоритм и как он работает в основных поисковых системах?

10 инструментов, чтобы узнать, есть ли у меня дублированный контент на моем сайте

10 инструментов, чтобы узнать, есть ли у меня дублированный контент на моем сайте

Для анализа дубликатов самое разумное - начать с заголовков, заголовков, описаний и подобных разделов. Наиболее эффективные методы его выявления - использование инструментов.

И когда я говорю «инструменты», я не только ссылаюсь на различные типы платформ или программного обеспечения, созданного для него, но я также говорю о методах поиска, таких как «site:», о которых я расскажу позже:

1. Консоль поиска Google

Это одна из лучших отправных точек. Для анализа этого и других вопросов, связанных с вашим собственным Интернет-домен , зарегистрируйтесь в инструментах Google для веб-мастеров и получите доступ к «аспектам поиска» и «улучшения HTML».

Далее посмотрите на ярлыки дубликатов заголовков и метаописаний. Вы найдете существующие реплики и страницы, чтобы вы могли их исправить.

Без сомнения, перейти к Google Search Console Это хороший вариант, чтобы обнаружить его в вашей сети.

2. SEMrush

Как вы знаете, SEMrush Помимо того, что он является одним из моих любимых инструментов, он также является одним из наиболее полных и, как таковой, включает в себя способ определения наличия проблем такого типа.

Он имеет очень полный инструмент «SEO-аудит» веб-сайта , где вы можете легко идентифицировать дублированный контент.

Он имеет очень полный инструмент «SEO-аудит» веб-сайта , где вы можете легко идентифицировать дублированный контент

3. Кричащая лягушка

Благодаря Кричащая лягушка Вы можете отслеживать сайт в поисках дубликатов, помимо других функций, которые позволяет вам этот мощный инструмент SEO. Для этого необходимо использовать фильтр «дубликат» на вкладках «Страница», «URL», «H1» и «Мета-описание».

Я должен предупредить вас, что это не бесплатный инструмент, однако его широкие функциональные возможности могут заставить вас поднять идею его найма. Мы говорим о чем-то вроде 160 евро в год.

Мы говорим о чем-то вроде 160 евро в год

4. Google Analytics

Если у вас есть доступ к отчетам « Поведение », « Содержимое сайта » и « Страницы назначения », вы также можете найти дубликаты. здесь, Google Analytics ищите страницы и URL-адреса, которые получают более низкий органический трафик, чем это соответствует.

5. Плагиат

Благодаря онлайн-инструменту Plagiarisma Вы можете определить, является ли текст оригинальным или соответствует уже опубликованному в сети, просто включив его в отведенное для него место.

Кроме того, вы можете загрузить свой PDF файл от Google Drive удобно, если вы храните свои сообщения в облаке, прежде чем публиковать их в своем блоге.

Лично у меня есть склонность к этому, учитывая его скорость и простоту, чтобы сообщить вам, если выбранный контент скопирован с другого, который уже существует в Интернете. Фактически это один из инструментов проверки, который я использую вместе со своей командой в JF-Digital.

Вы также можете скачать его и установить на свой жесткий диск, если хотите.

6. Кветекст

Это простая и интуитивно понятная онлайн-платформа, которая после вставки в отведенное для этого места фрагмента текста дает вам всю необходимую информацию, чтобы узнать, скопирован он или оригинал.

с Quetext Вы можете точно знать, какие другие веб-сайты являются теми, которые уже опубликовали текст, идентичный тому, который вы указали для инструмента, таким образом отмечая точные фрагменты, которые, следовательно, вы не должны публиковать на своей странице , если не хотите, чтобы вас наказывали.

с   Quetext   Вы можете точно знать, какие другие веб-сайты являются теми, которые уже опубликовали текст, идентичный тому, который вы указали для инструмента, таким образом отмечая точные фрагменты, которые, следовательно, вы не должны публиковать на своей странице , если не хотите, чтобы вас наказывали

Существует большое количество инструментов веб-анализа для выявления неработающих ссылок, неиндексированных страниц и дубликатов, а также других проблем, которые сложнее обнаружить.

Эти инструменты мы увидим позже и среди прочих - Siteliner или SEMrush.

Помимо того, что он один из моих любимых, он широко используется большим количеством специалистов по цифровому маркетингу и Интернету в целом.

с CopyScape Вы можете ввести URL своего сайта и проверить, есть ли в сети другой текст, идентичный вашему. Таким образом, вы можете связаться с ответственным лицом и попросить объяснений для этого.

8. Команда «site:» + «Ключевое слово» в Google

Эта команда выполняет поиск в Google, проиндексированных страницах вашего веб-сайта с определенной фразой или определенным ключевым словом (или в продуктах, если мы говорим о магазин онлайн на PrestaShop или аналогичный ).

Например, среди результатов вы можете проверить, есть ли в Google проиндексированные страницы с описаниями или дублирующими заголовками и были ли некоторые из них перемещены во вторичный индекс. В то же время, это также отличный способ найти каннибализации SEO.

В то же время, это также отличный способ найти каннибализации SEO

9. Инструменты Virante

Очень эффективно выявлять основные аспекты, которые должен выполнять блог, чтобы не допустить двуличия.

В идеале все «чеки» должны быть зелеными, а если вы найдете один «красным», то именно там мы должны работать, чтобы исправить ошибку.

Если в Инструменты Virante первая проверка выделена красным, это означает, что URL-адрес не является каноническим и что формат URL-адреса выбран неправильно. Это самая большая ошибка, с которой мы сталкиваемся сегодня.

10. SiteLiner

С помощью этого онлайн-инструмента вы можете обнаружить дублирующийся контент небольшого веб-сайта. С его бесплатной версией вы можете анализировать до 250 страниц.

Поэтому даже для начала, с SiteLiner Тебе достаточно.

Как я могу удалить дублированный контент в моем блоге или на сайте?

Уже стало ясно, что поисковики не любят двуличия, потому что это обедняет пользовательский опыт , Поэтому, если вы обнаружите это, вы должны сделать «невозможное», чтобы устранить это.

Если вы сами продублировали его на своем сайте, есть несколько способов исправить это или убедиться, что поисковые системы знают, какой из них вы хотите использовать в качестве «основного».

Проблема в том, что вы должны знать некоторые программы, и не все могут писать коды в нужных местах в Интернете.

Если вы не владеете языком HTML, я советую вам обратиться за помощью к специалисту или нанять его услуги.

На этом этапе статьи вы уже должны знать о важности отсутствия дублированного контента, если вы хотите, чтобы ваш сайт не был делегирован постам (или страницам), наиболее задержанным в поисковой выдаче Google.

Наиболее распространенные способы устранения дубликатов на нашем сайте:

1. Измените текст

Это один из самых простых способов, но в свою очередь менее используемый. Поэтому, если у вас две очень похожих страницы и вы хотите разместить обе в поисковых системах, выберите перезаписать содержимое одного из этих URL-адресов так, чтобы оно было как можно более оригинальным.

2. Сделать «Каноник»

Ярлык "rel = canonical" был создан для решения этой ситуации. Например, он широко используется в электронной коммерции, когда у нас есть продукты с очень похожими описаниями.

«Rel = canonical» - это строка кода, которая вставляется в <head> кода вашей страницы и указывает поисковикам, что является его оригинальной версией. И, следовательно, он не позволяет им каталогизировать это содержимое как дубликаты.

Здесь мы должны иметь в виду, что с этим атрибутом именно поисковые системы принимают окончательное решение о том, что делать с этими страницами, то есть они решают, индексируют ли они все или только основные (или канонические).

Это решение, которое каждый может применить на практике. Но также верно и то, что вам нужно иметь некоторые знания HTML, чтобы разместить метку в нужном месте, или иметь плагин / модуль, который поможет вам в этой работе.

3. Перенаправление 301

Это лучший вариант, когда невозможно использовать предыдущий ярлык или если у вас есть два проиндексированных URL-адреса, которые ведут в одно и то же место.

С Redirect 301 посетители автоматически отправляются с одной страницы на другую, которая нас интересует автоматически.

То есть вы можете использовать его в основном в двух ситуациях:

1º Если у вас есть две идентичные или чрезвычайно похожие страницы, и по каким-либо причинам вы не можете использовать канонические, то вам следует перенаправить одну на другую (принимая во внимание ее актуальность или важность, поскольку одна из них исчезнет перед вашими посетителями) ,

2-й Посетители вашего сайта могут получить доступ к одной и той же целевой странице с разных URL. Перенаправляя 301 из всех этих URL на основной или правильный URL, откуда бы они ни исходили, вы направляете своих посетителей и поисковые системы на один URL.

И, кстати, мы сообщаем поисковым системам, какой «правильный» URL и что они должны индексироваться.

4. Robots.txt

Это еще одно из действий, чтобы избежать двуличия на страницах.

Если по какой-либо причине вы не можете перенаправить или удалить страницу с дублированным содержимым, это лучший вариант, чтобы избежать страшных штрафов.

С файлами Robots.txt мы сообщаем поисковикам, какие страницы или файлы следует игнорировать или блокировать, и, следовательно, не должны тратить на это ни одной миллисекунды.

4. Использование параметров URL

Если дублирующийся контент создается по определенным параметрам, из "сканирования" и "параметров URL" , вы можете указать Google, что игнорировать, используя консоль поиска (Инструменты для веб-мастеров).

Процедура почти такая же, как и в Robots.txt: она сообщает поисковым системам, какие URL индексировать, а какие игнорировать.

Этот метод очень полезен, особенно для электронной коммерции с разными размерами и цветами одного и того же продукта. URL-адрес будет одинаковым для всех переменных размеров и цветов, но веб-мастеру будет интересно только выделить одну из них с общим описанием продукта.

5. Единственный редактор

Если вы публикуете свой блог самостоятельно, вы генерируете дублирующую информацию без вашего ведома на страницах автора. В WordPress они обычно бывают следующего типа:

https://dominio.com/author/tu-nombre

Решение очень простое: вы должны пометить страницы автора как « noindex - follow », чтобы вы указали поисковой системе не индексировать эти URL-адреса.

Это нужно делать только при наличии одного автора. Тем не менее, в блогах или цифровых журналах, где есть множество авторов, вам не помешало бы это сделать.

Категории и плохо используемые ярлыки могут быть очень опасными для вашего позиционирования в SEO.

Например, в обычном блоге, вопреки тому, что вы думаете, индексирование такого типа материалов служит только для создания дублирующегося контента или каннибализации.

Тем не менее, если вы хотите проиндексировать категории и / или ярлыки вашего блога, делайте это стратегически, с большой осторожностью и не создавайте их в промышленных масштабах без какой-либо последовательности или смысла.

Опять же, если вам не ясно, что вы можете сделать, это добавить « мета-теги: noindex, follow » среди вариантов вашего плагина SEO (если вы обычно используете WordPress), и, таким образом, вы не будете создавать дублирующийся контент с ними.

Как решить дублирование контента, когда вы находитесь вдали от вашего сайта?

Как решить дублирование контента, когда вы находитесь вдали от вашего сайта

После просмотра всех существующих форм, чтобы обнаружить его в нашей собственной сети и различные способы решения этой проблемы. Посмотрим теперь, что мы можем сделать, когда он находится в чужом домене.

1-й вариант: просьба исключить

В этом случае вы можете запросить «любезно» удалить по электронной почте, через социальные сети или через контактную форму.

Приветствия, человек, который плагиат вас, не знает, как это может быть плохо для вас обоих.

Если этот первый контакт не приносит плодов, что, к сожалению, происходит с определенной частотой, мы должны сделать второй шаг.

2-й вариант: каноническая ссылка

Хотя я вижу, что это трудно получить, если вы не хотите, чтобы устранить это, вы можете попросить, чтобы они ссылались на ваш текст с « каноническим ».

И, таким образом, поисковая система найдет оригинальный контент, и ни один из них не рискует быть оштрафованным.

Но этот 2-й вариант может не работать, что также часто случается.

Затем перейдем к «громким словам»: попросите Google проиндексировать ваш URL.

Для этого вы должны подать заявку в соответствии с законодательством США о защите авторских прав.

Вы также можете отправить отчет о спаме в Google через ЭТА ССЫЛКА или, если у вас нет учетной записи для веб-мастеров, вы можете сообщить об этом в блог из раздела «Отчет о спаме» ( ДОСТУП ОТ ЗДЕСЬ ).

Во всех этих случаях рекомендуется сэкономить все усилия, предпринятые ранее для решения проблемы своими силами.

Сохраняйте копии электронных писем или сообщений, отправленных / полученных вами от веб-мастера сайта, с дублированным контентом.

4-й вариант: обычное правосудие

Последний вариант, который вы оставили, если все остальное не работает, - это обратиться к обычному правосудию вашей страны, чтобы они применили действующее законодательство.

Вы должны подать жалобу на преступление плагиата. Начиная с публикации онлайн текстов , ничем не отличается от того, публикуете ли вы тексты на бумаге .

Все, что вы делаете в цифровой форме, автоматически имеет авторские права, и, следовательно, вы можете прибегнуть к правосудию, чтобы судья осудил плагиатор на удаление плагиата.

И, кстати, чтобы компенсировать вам материальный ущерб за причиненный ущерб, если это применимо.

Этот последний метод может показаться слишком экстремальным, но вы должны иметь в виду, что есть много людей, которые зарабатывают на жизнь с помощью своего веб-сайта или блога (как в моем случае).

Посетители, которые приходят к нему, нанимают свои услуги, покупают их товары или просто нажимают на объявления.

Двойной контент на сайтах такого типа может значительно снизить ваши доходы.

выводы

В заключение я дам вам несколько общих советов, которые помогут вам предотвратить эту проблему:

  • Первый совет является базовым, и вы наверняка уже сами об этом думаете: текст ваших страниц должен быть уникальным в каждой из них.
  • Будьте осторожны с URL-адресами, которые генерируются автоматически и могут привести вас на ту же страницу.
  • Никогда не используйте один и тот же заголовок или одно и то же описание на разных страницах.
  • Даже если вы имеете дело с тем же предметом, вы должны дать другую точку зрения и попробовать разные подзадачи для ранее опубликованных.
  • Включите только каноническую версию любой страницы в вашу карту сайта.
  • Если вам нужно скопировать встречу, постарайтесь сделать ее небольшой частью всего текста.
  • Если по какой-либо причине у вас будут очень похожие страницы, просто позвольте поисковой системе иметь доступ только к одной странице с помощью «роботов» или используйте тег «Canonical».
  • Выделите как минимум один час в неделю для выявления и устранения возможных неработающих ссылок (внешних или внутренних), а также для устранения всех найденных дубликатов.

В любом случае, не зацикливайтесь, потому что практически невозможно уменьшить его до «нуля». Как правило, веб-сайт имеет около 10% или 15% этого дублированного контента.

Конечно, никогда не быть на ваших главных страницах. Те, которые радикально влияют на вашу видимость и результат ваших стратегий.

А вы, вы когда-либо обнаружили дублированный контент в вашем домене или за его пределами? Какой инструмент вы использовали?

Основные изображения ( выполнение ) из Freepik.

Я хотел бы услышать ваше мнение, поэтому, если вы столкнулись с этой проблемой, расскажите мне ваше дело.

Что такое дублированный контент?
Можно ли оштрафовать за дублированный контент?
Почему дубликаты контента так негативны для моего сайта?
Почему?
Можно ли оштрафовать за дублированный контент?
Почему дубликаты контента так негативны для моего сайта?
Как я могу удалить дублированный контент в моем блоге или на сайте?
Как решить дублирование контента, когда вы находитесь вдали от вашего сайта?
А вы, вы когда-либо обнаружили дублированный контент в вашем домене или за его пределами?
Какой инструмент вы использовали?