Что такое LSI или как Google и Яндекс понимают контекст веб-страниц?
LSI (ЛСИ) — что это такое? Как Google и Яндекс понимают контекст веб-страниц.
  1. Что влияет на результаты поисковой выдачи?
  2. Общие сведения о LSA (ЛСA)
  3. Что такое ЛСА (LSA)?
  4. О теории LSI (Latent Semantic Analysis)
  5. Как Google и Яндекс оценивают контекст страниц?
  6. Как идентифицировать LSI-ключи?


Что влияет на результаты поисковой выдачи?

LSA (расшифровка аббревиатуры Latent semantic analysis) - это латентно-семантический анализ (на русском языке также используется сокращение ЛСА), являющийся методом обработки текстовой информации, используемым алгоритмами поисковых систем. Этот анализ позволяет определить взаимосвязь между различными терминами и документами на основании сопоставления и проверки связей в общей совокупности коллекций документов.

LSA (расшифровка Latent semantic analysis)

Общие сведения о LSA (ЛСA).

В основе LSA лежит факторный анализ, позволяющий выявлять скрытые связи между объектами и явлениями. При группировке текстовых документов данный метод применяется для определения зависимых в плане контекста значений в рамках статистической обработки больших объемов данных.

Латентно-семантический анализ — это фактически простейший вид нейросети, в составе которой имеется три слоя:

  • первый включает большой набор терминов (слов);
  • второй — это определенное множество документов, которое соответствует определенным условиям анализа;
  • третий — это средняя скрытая прослойка, которая является узловой системой с разными коэффициентами и связывает два первых слоя друг с другом.

Что такое ЛСА (LSA)?

Основной смысл LSA заключается в том, что при одних условиях связи между двумя любыми терминами (словами) может и не наблюдаться, но после определенных преобразований зависимость все же проявляется. К тому же показатель этой зависимости будет обусловлен силой семантико-ассоциативной связи между исходными терминами.

Для понимания разберем на примере:

Предположим, что на двух сайтах имеются следующие текстовые фрагменты:

  • первый источник — реклама: «Сей фантастический смартфон N получил емкий аккумулятор»;
  • второй источник — запись в блоге «между прочим, батарейка у N долго держит заряд».

Лексика рекламного сообщения и текста в блоге отличается, поэтому и фразам типа «батарейка», «аккумулятор» присваивается разный вес. Допустим, первому - относительно большой, а второму - относительно малый. И имеющиеся фрагменты можно объединить только по названию устройства «N», а все подробности о батарейке/аккумуляторе пропадут.

Благодаря латентно-семантическому анализу весомость близких по сути терминов - «аккумулятор» и «батарейка» подравняется, причем оба фрагмента текста можно объединить на основании общего и важного для товара «N» параметра (автономность), хоть связующим звеном между фразами выступает одно единственное слово.

Именно так LSA «объединяет» и «стягивает» в одну группу (кластер) разные по стилистике и написанию, но связанные по смыслу термины.

О теории LSI (Latent Semantic Analysis).

Начнем с азов. Благодаря таким гугловским алгоритмам, как Колибри или Панда, самый крутой поисковик сегодня хорошо распознает не только сам контент, но и контекстную составляющую страниц. Рассмотрим этот вопрос на примере.

Если вы вводите запрос "kino", то задача поисковика достаточно сложна, нужно понять, что вы ищете:

  • фильмы;
  • кинотеатры;
  • информацию о рок-группе.

Вариантов, которые могут оказаться в выдаче, очень много. Задача поисковой машины определить, релевантные для пользователя варианты и предложить вам!

Как Google и Яндекс оценивают контекст страниц?

В этом аспекте поисковик и возлагает большие надежды на латентно-семантический индекс (далее LSI), чтобы распознавать контекст.

Если поисковые боты обнаруживают на веб-странице слова - кинофильм, режиссер, актеры, то понять о чем веб-страница несложно, контекст становится понятен.

Как идентифицировать LSI-ключи?

Как идентифицировать LSI-ключи?

С этим не возникнет сложностей. Несколько элементарных способов позволит собрать данные, нужные для SEO слова и оптимизировать с их помощью продвигаемый ресурс.

Способы сбора семантических данных для сайта.

1. Похожие результаты.

Введите основной запрос в строку поиска и переходите в самый низ результатов - "вместе с "ключ" ищут". Там, поисковик и предлагает LSI-ключи, выделяя их жирным. Позаботьтесь о том, чтобы данные слова присутствовали в контенте продвигаемой страницы.

Как это сделать:

  • собираем ключи, имеющие для нас смысл;
  • отсеиваем все то, что не связано с нашим сайтом.

Данный вариант является простейшим, чтобы найти LSI-фразы и применять их непосредственно для оптимизации страничек.

2. Выделенные слова и фразы в выдаче.

Введите в поиске слово и анализируйте результаты - все словосочетания с жирным шрифтом. Эти ключи также стоит добавить в содержание продвигаемой страницы.

3. Применяем Google Planner

Получить информацию о LSI-ключам можно и в гугловском планировщике ключевиков. Для этого нужно:

  1. Задать страничку конкурента.
  2. Просмотреть все ключи.
  3. Почерпнуть те из них, которые тематически и по сути подходят вашему сайту.

Сделать подобное следует хотя бы по первой десятке выдачи по продвигаемым вами ключам. В результате вы получите:

  • собственно LSI-ключи;
  • другие ключевые фразы, которые не используются вами, но способствуют выходу в ТОП.

После этого следует оптимизировать содержание страницы под эти ключевые слова. Результаты - в виде роста трафика не заставят себя долго ждать.

LSI ключи активно используются многими оптимизаторами. А все, что понадобится для учета данного важного в Google и Яндексе фактора, это найти их, отобрать нужные, оптимизировать контент на продвигаемом сайте под эти слова и словосочетания.

Заберите ссылку на статью к себе, чтобы потом легко её найти!
Раз уж досюда дочитали, то может может есть желание рассказать об этом месте своим друзьям, знакомым и просто мимо проходящим?
Не надо себя сдерживать! ;)

Старт! Горячий старт на просторы интернета
Старт! Горячий старт на просторы интернета
Старт! Меню