Метаданные поисковиков и новый инструмент Google Маркер, Schema.org

Меня давно привлекала идея добавления семантики к разметке сайта. Вообще, давным давно, еще до рождения сематических тэгов HTML 5, когда я только познакомился с RSS лентами и прочими вариантами агрегации сайтов, у меня возникла мысль что в скором будущем возникнет некий единый стандарт построения сайтов, который поможет легче воспринимать контент не только людям, но и роботам. В частности, на всех сайтах есть страницы About, Contacts на которых есть стандартная информация. Почему бы не сделать её понятной поисковым роботам, чтобы те могли автоматически, к примеру агрегировать сайты автора, создать его профиль и т.д. Многое из этого в наше время уже доступно, но мои утопичные фантазии конечно были намного безграничнее еще в те времена… На пути унификации CMS, структуры сайтов и семантики их наполнения пока слишком много преград, но движение в этом направлении есть.

В общем, это предыстория, а речь пойдет о метаданных или структурированных семантических (смысловых) объектах, тем или иным образом указанных в HTML разметке страницы. Стандартизация этих объектов позволяет различным поисковикам воспринимать эту более детальную атрибутивную информацию и отображать при необходимости её в поисковом сниппете, а не просто вырезку из текста страницы. Два наших основных поисковика, Гугл и Яндекс уже научились воспринимать некоторые из таких объектов и имеет смысл размечать такую информацию на страницах ваших сайтов.

Данная тема очень обширна. Так что эта статья — только лишь отправная точка в её изучении. Больше же информации можно найти в документации и поддерживаемых форматах Google, в документации и воспринимаемых форматах Яндексом, а также в этом переводе статьи «Вся правда о структурированных данных и Schema.org».

Также можно посетить Schema.org и ознакомьтесь с перспективной коллекцией общепринятых разными поисковиками схем разметки структурированных данных. Это некая общая единая база стандартов, на которую ориентируются поисковики, по мере обучения их роботов распознаванию всё новых и новых форматов.

Рассмотрим эволюцию распознавания структурированных данных на примере поисковика Google.

Мастер разметки структурированных данных

Вначале Гугл предложил использовать свой специальный мастер микроразметки. Этот инструмент помогает вручную добавить разметку структурированных данных выбранного из имеющихся объектов на вашу веб-страницу. Здесь всё просто, но не автоматизированно.

У меня получился такая мета-разметка Мероприятия (Event) созданная мастером разметки структурированных данных Google:

Мета-разметка показывает Гуглу и другим поисковикам семантическое значение текстовых фрагментов

Добавились атрибуты тэгов: itemscope itemtype, itemprop которые собственно и являются мета-разметкой, показывающей Гуглу и другим поисковикам семантическое значение текстовых фрагментов

Второй шаг в эволюции — Google Маркер

Далее появился более автоматизированный способ пометки метаданных страницы с помошью мышки и применение этого действия сразу к группе страниц. Гугл автоматически анализирует содержимое целой группы однотипных страниц. Вебмастеру лишь достаточно указать ключевые поля на одной из таких страниц, а потом подтвердить или откорректировать автоматическое распарсивание нескольких других страниц.

Что показала проверка структурированных данных

Добавив необходимый код на свой сайт, воспользуйтесь Инструментом проверки структурированных данных. Он позволяет узнать, понимает ли Google вашу разметку.

Кстати, в моем случае, при проверке автоматически сгенерированной разметки Google Маркером, валидатор выдал ошибку. Проблема была связана с тем, что данные одного подобъекта Place находились в разных строках таблицы. Пришлось прибегать к тегам meta (выделить в них обект Place), на которые структура HTML не влияет.

Третий и самый надежный метод — разметка в ручную

Так как в моем случае стандартные инструменты не смогли дать полностью валидный вариант в силу таблиц на странице, а также заданных по-русски интервалов дат, то я, опираясь на уже полученную разметку, адаптирую её к своему сайту, добьюсь её валидности и размещу в HTML коде страниц. Этот способ, хоть и самый сложный, но самый правильный, в силу того, что не будет никакой зависимости конкретно от Гугл, разметку смогут воспринимать все обученные роботы.

Об итогах эксперимента обещаю написать по факту получения от него плодотворных результатов. Теория теорией, посмотрим что покажет практика.

Совместимость с Яндексом

Яндекс, также как и Google предусматривает наличие микроданных, микроформатов и в том числе метаданных в формате schema.org. Но, к сожалению, список поддерживаемых объектов в Яндексе и в Google отличаются. Что касается объекта «Event», то оно к сожалению, не присутствует в анализаторе Яндекса. В любом случае, не помешает проверить вашу семантическую структуру данных в валидаторе микроразметки Яндекса.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *