Optimización para Hanukkah: a veces sigue siendo cuerdas, no cosas

Optimización para Hanukkah: a veces sigue siendo cuerdas, no cosas
Google se ha vuelto más inteligente al reconocer variantes ortográficas de la misma entidad, pero el columnista Paul Shapiro observa que todavía no es perfecto.
Paul Shapiro el 15 de diciembre de 2017 a las 11:39 a.m.
MÁS

Mi esposa vino a mi con un problema. Ella quería un pijama de Hanukkah festivo, caprichoso y potencialmente a juego. Pero no había suficientes opciones en Google en una ortografía del nombre de la fiesta, por lo que me dijo que estaba revisando sistemáticamente todos los deletreos para compilar su lista de artículos de compras.

Estaba bastante sorprendido por esto, esperaba que Google fuera lo suficientemente inteligente como para reconocer que se trataba de ortografías alternativas de la misma cosa, especialmente post-Hummingbird. Claramente, este no fue el caso.

Algunos antecedentes para aquellos que no saben: Hanukkah es en realidad una palabra transcrita del hebreo. Dado que el hebreo tiene su propio alfabeto, hay muchos deletreos que uno puede usar para referirse a él: Hanukkah, Chanukah y Channukah son todos aceptables deletreos de las mismas vacaciones.

Por lo tanto, cuando alguien busca “pijamas de Hanukkah” o “pijamas de Janucá”, Google debería ser lo suficientemente inteligente como para comprender que son deletreos diferentes del mismo concepto y proporcionar resultados casi idénticos. ¡Pero Google no! Me imagino que esto sucede para otras fiestas y nombres de otras culturas, y me gustaría saber si otros lectores experimentan el mismo problema con ellos.

¿Por qué me sorprende que Google devuelva resultados diferentes para diferentes deletreos? Bueno, con la introducción de Knowledge Graph (y Hummingbird), Google marcó un cambio para SEO. Más que nunca, podríamos comenzar a pensar en las consultas de búsqueda no solo como cadenas de palabras clave, sino como conceptos interrelacionados del mundo real.

¿Qué quiero decir con esto?

Cuando alguien busca a “Abraham Lincoln”, es más que probable que busque la entidad que representa al decimosexto presidente de los Estados Unidos, en lugar de la aparición de las palabras “Abraham” y “Lincoln”, o su tío, también llamado Abraham. Lincoln. Y si buscan “fiesta de Lincoln”, Google sabe que probablemente estamos hablando de partidos políticos, en lugar de fiestas en la ciudad de Lincoln, Massachusetts, porque este es un concepto en estrecha asociación con la entidad histórica Abraham Lincoln.

Del mismo modo, Google es ciertamente capaz de comprender que cuando usamos la palabra clave Hanukkah, se hace referencia a la entidad vacacional y que las diversas formas de deletrear también se refieren a la misma entidad. A pesar de las diferentes grafías, las diferentes búsquedas en realidad significan lo mismo. Pero, por desgracia, como lo demostró la necesidad de mi esposa de realizar una búsqueda diferente para cada ortografía de las vacaciones con el fin de descubrir todas sus opciones de pijamas de Hanukkah, Google no estaba haciendo el mejor trabajo.

Entonces, ¿cuán extendido está el problema de búsqueda de Janucá / Hanukkah / Janucá? Aquí hay un par de resultados de búsqueda para artículos de Janucá:
Como puede ver en la primera captura de pantalla, algunos minoristas de grandes cajas como Target, Macy’s y JCPenney se clasifican en la primera página de Google. En la captura de pantalla dos, sin embargo, están en gran parte ausentes, y sitios como PajamaGram y Etsy están dominando los diferentes SERP de ortografía.

Esto significa que las tiendas que se dirigen al pequeño grupo demográfico de los compradores de Hanukkah en realidad están reduciendo el número de clientes potenciales al usar solo una ortografía en su página. (De hecho, de acuerdo con mi herramienta de palabras clave preferida, aunque “Hanukkah” tiene el mayor volumen de búsqueda de todas las variantes en 301.100 búsquedas mensuales globales, todas las demás ortografías combinadas aún constituyen una cantidad considerable de 55.500 búsquedas, lo que significa que los minoristas pueden optimizar ambos términos. viendo un 18 por ciento más de tráfico).

Investigar variaciones de ortografía y observaciones
Como soy una persona curiosa, quería investigar este fenómeno un poco más.

Creé una herramienta pequeña y simple para mostrar cuán similares son las páginas de resultados del motor de búsqueda (SERP) para dos consultas diferentes al examinar qué listados aparecen en ambos SERP. Si nos fijamos en cinco deletreos comunes de Hanukkah, vemos lo siguiente:

Palabra clave 1 Palabra clave 2 SERP Similitud
Channukah Chanukah 90.00%
Channukah Hannukah 20.00%
Channukah Hannukkah 20.00%
Channukah Hanukkah 30.00%
Janucá Hannukah 20.00%
Chanukah Hannukkah 20.00%
Chanukah Hanukkah 30.00%
Hannukah Hannukkah 90.00%
Hannukah Hanukkah 80.00%
Hannukkah Hanukkah 80.00%
La herramienta muestra algo bastante interesante aquí: no solo los resultados son diferentes, sino que dependiendo de la ortografía, los resultados pueden ser idénticos en un 20 por ciento, lo que significa que ocho de cada 10 de las listas en la página uno son completamente diferentes.

Entonces sentí curiosidad acerca de por qué los términos no se canonicalizaban entre sí, así que miré a Wikidata, una de las principales fuentes de datos que Google usa para su Knowledge Graph. Como resultado, hay una entidad con todas las variantes contabilizadas:
Luego revisé la API de búsqueda de gráficos de Google Knowledge, y quedó muy claro que Google puede estar confundido:

Leave a Reply

Your email address will not be published. Required fields are marked *