Розбиття сторінок електронної комерції та дублювання контенту

Так що ж велика справа?
Деякі рішення
Варіант №1: Розбиття JavaScript
Варіант №2: Розбивка AJAX
Варіант №3: Відсутність слідування
Варіант №4: Наш ідеальний сценарій

З Енді Макдауеллом, який грає роль Googlebot ...

Ви коли-небудь бачили фільм Mulitplicity ? Ви також запускаєте / керуєте сайтом електронної комерції? Якщо так, то ви повинні точно знати, що я маю на увазі, навіть не читаючи далі. Це не є сигналом для того, щоб натиснути кнопку "Назад" зараз, але замість цього вказується на те, що те, що я збираюся поділитися з вами, проллє світло на цю важливу тему і як вона впливає на всіх інтернет-продавців - і дійсно будь-який веб-сайт з розбиттям на сторінки справі.

Більшість інтернет-магазинів використовують розбивку в каталогах своїх продуктів, і багато хто навіть не розуміють основних ефектів цієї функції. Ця тема - це те, про що я займаюся протягом останнього року, і я близька і дорога моєму серцю. Це занепокоєння, що не тільки охоплює SEO, але й зручність, тому важливо визначити баланс між цими потребами.

Так що ж велика справа?

Проблема полягає в тому, що нумерація сторінок може вводити дублікати проблем на вашому веб-сайті. Традиційний механізм розбиття сторінок на електронну комерцію розділяє ваш список продуктів на кількість сторінок динамічно, при цьому кожна сторінка має майже ідентичний вміст, а також ідентичні назви та теги опису. Отже, сторінки 2, 3, 4 і т.д., як видається, в основному однакові.

Не тільки це, але на багатьох сайтах, які ми бачимо, сторінка 1 фактично є точним копією першої сторінки, яку користувач відвідує, але має іншу URL-адресу. Наприклад, URL-адреса сторінки Pepsi T-Shirts може бути / сорочки / pepsi, де querystring додається для нумерації сторінок так: / shirts / pepsi? Page = 2, / shirts / pepsi? Page = 3, etc. виявили, що багато платформ eCommerce насправді посилаються на сторінку 1 як / сорочки / pepsi? page = 1 - таким чином створюючи точний дублікат / сорочки / пепсі. Ми фактично визначили це як проблему в BV Commerce (один з наших партнерів програмного забезпечення) і створили налаштування для вирішення цієї проблеми ( зв'яжіться з нами якщо вам потрібний вихідний код)

Там є багато інформації про дублікати змісту на сайті SEO питання, які я не буду переробляти тут, але розумію, що це може представляти проблему для власників сайтів в ряді фронтів - канонізація, дублювання вмісту, і Розведення PageRank . Якщо МП бачать, що у вас є 10 сторінок, які все виглядають так, як вони продають сорочки Pepsi - як вони будуть знати, який з них показувати в результатах пошуку (чи не було б приємно, якщо б вони показали всі 10 ваших)?

Відвідуючи останні SMX Advanced шоу в Сіетлі, я обговорював це важливе питання з Габ довго, хто запропонував мені зібрати цю статтю з цього питання. Незабаром цю тему також висвітлював Ренд Фішкін у SEOmoz "Дай це" Дошці п'ятницю відео. Тому я радий бачити, як ця тема привертає багато уваги.

Деякі рішення

Тепер рішення, які я представляю тут, є різними методами, що використовуються різними торговцями для боротьби з цими проблемами. Кожен з цих методів має як переваги, так і недоліки, і важливо розуміти ці наслідки, а не тільки те, що вони можуть означати для вашого сайту з точки зору SEO, але й з точки зору зручності та функціональності, а також як ці рішення пов'язані з фільтрацією та сортування.

Варіант №1: Розбиття JavaScript

Розбиття на сторінки за допомогою Javascript може бути здійснено шляхом завантаження всіх "сторінок" результатів у теги <div> і використання Javascript, щоб приховати / показати відповідний div, коли сторінка обрана користувачем. Ви повинні були б переконатися, що існує якась сумісність для браузерів, у яких вимкнено Javascript (це дуже невелика кількість). Крім того, потрібно враховувати, що, хоча "сторінки", як divs не видно користувачеві, зображення все одно будуть завантажені, коли сторінка завантажується, тим самим збільшуючи час завантаження сторінки. Таким чином, ви хочете переконатися, що ви можете керувати, коли зображення дійсно завантажуються на клієнта (після завантаження сторінки). Це стає дещо складнішим, коли ви розглядаєте параметри фільтрації та сортування, якщо вони реалізовані на стороні клієнта та сервера, і як вони прив'язані до пейджингового зв'язку.

Варіант №2: Розбивка AJAX

AJAX можна використовувати для комбінування Javascript і серверного коду, щоб дозволити вам динамічно витягувати дані, лише оновлюючи частину сторінки - таким чином підтримуючи той самий URL. Таким чином, у цьому сценарії вам слід створити сторінку, на яку при завантаженні буде перераховано лише першу сторінку результатів, і коли користувачі натискатимуть, щоб переглядати додаткові сторінки, вони фактично завантажуються через AJAX, що дозволяє підтримувати одну і ту ж URL-адресу сторінки - так що всі ваші сторінки вміст може бути фактично завантажено через одну фізичну URL-адресу. Ця ж методика може бути застосована до параметрів фільтрації та сортування, забезпечуючи, таким чином, одну послідовну технологію, яка буде використовуватися для класифікації.

Ми бачили, як торговці намагаються застосувати цей метод для обробки сторінок зі змішаними результатами. Деякі з питань, які виникають з цього, полягають у тому, що пошукові системи зазвичай (хоча докази показують, що для довірених сайтів, які вони починають) не подають форму павуків, тому пошукові системи можуть ніколи не потрапити на більш глибокі сторінки і можуть мати проблеми з індексацією фактичні продукти, які знаходяться на цих сторінках. Крім того, ми бачимо проблеми з юзабіліті з AJAX, як правило, коли вона включає користувача, натиснувши кнопку «назад». Це найчастіше завантажує сторінку за промовчанням із типовими налаштуваннями і не пам'ятає, на якій сторінці ви були, які критерії фільтрації ви встановили, і т.д. Тому важливо, щоб інтернет-магазини, що використовують AJAX, мали певний спосіб запам'ятати цих параметрів (наприклад, змінні сесії).

Варіант №3: Відсутність слідування

No-Follow Pagination - це те, що було внесено спільнотою SEO певний час назад, і в основному це означає, що додавання атрибуту nofollow (і noindex на цих сторінках) до кожної сторінки, так що пошукові системи лише індексують першу сторінку цієї категорії. Це полегшує проблему повторюваного вмісту, але значно зменшить кількість індексованих сторінок, і ви хочете переконатися, що у вас є інші засоби для посилання на продукти, які фактично містяться на більш глибоких сторінках (наприклад, файл sitemap.xml або on- категорія сайту перелік продуктів або навіть приховування повного списку продуктів до МП на цій сторінці).

Варіант №4: Наш ідеальний сценарій

Всі три варіанти, представлені вище, стосуються питання про дублювання вмісту, що існує в різних паґінаціях, і способи його вирішення. Однак ми визначили ідеальний сценарій, який представляє найменшу кількість недоліків, вирішуючи це питання в тому, що ми вважаємо найкращим чином. Цей сценарій включав би всі сторінки, завантажені в div, як описано у варіанті № 1, де javascript обробляє розбиття сторінок. Завантаження зображень контролюватиметься через DOM і завантажуватиметься лише в браузер, коли ця сторінка активна. Це дозволить всім вашим продуктам бути перераховані на одній сторінці, звести до мінімуму час завантаження, а пошукові системи матимуть можливість переглядати кожну з цих сторінок. AJAX буде використовуватися для керування функціями сортування та фільтрації - з яких ці сторінки не повинні бути пропущені або індексовані, тому що вони є лише підмножинами основного набору продуктів, які пошукова система вже розібрала. Крім того, щоб забезпечити, щоб кожен відвідувач веб-сайту, з або без JS, міг використовувати сайт, буде використана функція нумерації сторінок, що поєднує метод №3 з наступною традиційною структурою пейджингового зв'язку.

Для створення цього надійного рішення для розбиття на категорії категорій, для отримання більш детальної інформації про цей фронт від Blue Acorn =), знадобиться чимало ресурсів для розробки та розробки.

Так що ж велика справа?
Ви також запускаєте / керуєте сайтом електронної комерції?
Так що ж велика справа?
Наприклад, URL-адреса сторінки Pepsi T-Shirts може бути / сорочки / pepsi, де querystring додається для нумерації сторінок так: / shirts / pepsi?
Page = 2, / shirts / pepsi?
Виявили, що багато платформ eCommerce насправді посилаються на сторінку 1 як / сорочки / pepsi?