Новости о выпуске «секретного» файла с руководящими принципами работы для команды качества поиска быстро распространились по всему миру. Версия от 2 ноября 2012 года доступна по этому адресу и является лишь фрагментом оригинала, хотя ее стоит прочитать. Ниже приведено сокращение от того, что я прочитал до сих пор в этом документе.

Начну с того, что результаты поиска Google оцениваются как алгоритмом, так и сотрудниками Google. Во втором случае одной из их задач является оценка целевой страницы в контексте искомой фразы именно на основе рекомендаций, разработанных Google. Оценивается, насколько полезна оцененная страница для пользователя. Самое важное в этой оценке — сопереживать поисковику и определять его намерения при поиске, что определяется на основе искомых фраз. Они делятся на следующие:

  • запросы действий — запросы, предполагающие, что пользователь ищет страницы, на которых он может выполнять действия в форме загрузки файла, размещения заказа и т. д. Часто эти фразы содержат такие слова, как «загрузка»;
  • информационные запросы — они указывают на поиск веб-сайтов с информацией по заданной теме, например, информацией о заболеваниях;
  • навигационные запросы — вы можете видеть, что пользователь хотел найти конкретную страницу.

Вам также следует учитывать местоположение искателя и оценивать соответствие результатов ему.

Вот некоторые правила, которые применяются при проведении оценки :

  • оценка относится только к целевой странице, которую пользователь вводит после ввода фразы. Весь сайт не оценен;
  • рейтинг относится только к контенту, предоставленному веб-мастером, а не к рекламе или ссылкам на другие сайты;
  • наиболее важным является то, соответствуют ли целевые страницы потребностям поисковика и в какой степени;
  • В дополнение к оценке пригодности, Google Rater может установить один из флагов на целевой странице: не спам, вероятно, спам, спам, вредоносный сайт;
  • Члены команды могут оценивать страницы только на том языке и в том месте, откуда они пришли, потому что им нужно знать намерения и словарный запас, который они используют лучше всего, чтобы сделать справедливую оценку
  • GQR (Google Quality Rater) может остановить оценку, если обнаружит подозрительный файл. Кроме того, он должен установить статус «Unratable», если страница возвращает заголовок 404, находится в разработке или отображает сообщение о вероятной вредоносности страницы.

При оценке очень важно определить, относится ли поисковая фраза к определенному значению. Например, слово «молния» не является однозначным — оно может означать структуру, молнию или замок из песка. Таким образом, 3 значения были установлены для неоднозначных фраз:

  • Доминирующее значение — это значение, которое большинство пользователей приходит на ум в первую очередь. Здесь приводится английский пример «окон», который большинство людей ассоциирует с операционной системой, а не множественное число слова «окно»;
  • универсальное значение — это запросы, которые имеют много общих значений, но ни один из них не является доминирующим;
  • редкий , несущественный смысл — здесь речь идет о незначительных, редко используемых значениях данной фразы.

Как оказалось, это разделение важно для дальнейшей оценки. Например, страницы, найденные после поиска редких фраз, должны быть оценены ниже, чем другие, потому что они с меньшей вероятностью будут соответствовать ожиданиям большинства пользователей Интернета.

Целевые страницы оцениваются по следующей шкале:

  • релевантный (от английского) — школа 5 — целевая страница была найдена после ввода навигационной фразы , которая четко указывает, что пользователь хотел попасть на эту конкретную страницу. Обычно это официальные веб-сайты людей, компаний, мест, организаций и т. Д. Интересно, что может случиться так, что содержание этих страниц будет не самого высокого качества, хотя такие ситуации должны быть редкими;
  • полезный — класс 4 — это высококачественные страницы (они не помечены как спам), имеющие отношение к поисковому запросу и полезные для большинства пользователей, которые ищут результаты для данного термина. Обычно они предоставляют текущую информацию по данной теме, поэтому они будут в основном популярными порталами, такими как wp.pl. Эти страницы хорошо организованы и являются надежным источником информации. В отличие от «жизненного» рейтинга, несколько целевых страниц могут быть помечены как «полезные»;
  • релевантный — класс 3 — полезен для многих пользователей и имеет отношение к поисковому запросу. Они менее обширны и актуальны, чем страницы, помеченные как «полезные», и поступают из менее надежных источников. Этот рейтинг нельзя отнести к странице с некачественным контентом;
  • немного релевантный — класс 2 — для большинства пользователей они бесполезны, но в некоторой степени они связаны с поисковым термином. Эти страницы могут быть низкого качества и содержать мало информации, или могут быть устаревшими. Другой тип страниц, оцененных как умеренно полезные, — это страницы, посвященные нишевой теме, или наоборот — слишком общие, они также относятся к не очень распространенным значениям поисковых терминов, о которых я уже упоминал. Последние типы страниц, которые могут быть упомянуты здесь, являются мобильными версиями, которые хуже, чем их полные версии;
  • не по теме, бесполезно — классная комната 1 — полезна для немногих пользователей, даже для любого. Они не связаны с поисковым запросом и, следовательно, не соответствуют ожиданиям пользователей Интернета. Они также могут вводить в заблуждение страницы или фокусироваться на рекламе и ссылках, но они практически не предоставляют контента. Обычно страницы с таким рейтингом помечаются как спам;
  • нет рейтинга (не подлежит оценке) — бывает, что сайт не может быть оценен по определенным причинам, но сотрудник должен как-то пометить его. К ним относятся страницы в стадии разработки, те, которые возвращают заголовок 404 или не загружены по другим причинам. Эта тема подробно описана в файле, но я пропущу этот момент, поскольку более ранние оценки для нас важнее.

// Append
Также обсуждалась тема свежего контента, который очень четко описан здесь. Среди начинающих пользователей существует миф, что для того, чтобы сайт был высоко оценен, он должен регулярно обновляться. Однако они забывают, что не каждый тип сайта требует этого.

В соответствии с информацией в руководствах, для фраз, указывающих, что пользователь ищет информацию о текущих событиях (например, предстоящей программе «Топ-модель»), важно найти текущую информацию. Если фраза указывает, что пользователь ищет, например, отчеты о некоторых событиях прошлого года, то наиболее точными будут результаты, описывающие события прошлого года. Есть также фразы, где дата обновления не имеет значения.

Таким образом, все зависит от того, действительно ли пользователь ищет текущую информацию или нет. Однако есть исключение — для целевых страниц с рейтингом Vital (Essential), а значит и официальных, актуальность контента не имеет значения. С ними обычно не обращаются так резко, как с другими.
// Append

Наконец, прочитайте интервью с одним из сотрудников, участвующих в оценке результатов поиска, и информацию об изменениях между оригинальной и общей версией файла . Пока я только просмотрел их, и в резюме, основанном на половине прочитанного документа. Вполне возможно, что после выходных будет продолжение.