La Búsqueda por Voz

Esther-Checa.jpg

ESTHER CHECA

El consumo por voz no es algo futurible, es otra interfaz de información más que ya la tenemos aquí. Google estima que el 20% de la todas las búsquedas ya son voz, pudiendo llegar a un 50% en el 2020. Junto al reto de su consumo, está la precisión con la que los asistentes pueden responder, en función de la plataforma, actualmente se está llegando a más del 90% (por ejemplo, Google Assistant está en un 91%, Baidú en un 95%, Cortana en un 82%, Alexa en un 87%, Siri en un 62%).  

1. asistente-de-voz-confiabilidad-IMG-1.png

Fuente: % Precisión de los principales asistentes de voz del mercado. ‘Apple's Siri ditches Bing for Google

El motivo por el que la búsqueda por voz está incrementando exponencialmente, es básicamente porque hay una relación directa en el incremento de búsquedas que hacen los usuarios debido al consumo multidipositivo. Google procesa una media de 40.000 búsqueda por segundo, 3.5 billones por día y 1.2 trillones al año a nivel mundial, si a esto le sumamos, que este buscador tiene una cuota de search de más de 91% a nivel mundial, se entiende el impacto y la necesidad de entender hacia dónde vamos y quienes son los actores principales.


Qué tenemos que saber antes de entender dónde están las oportunidades para llegar a nuestros potenciales consumidores

Los asistentes de voz son programas de software que responden a comandos de voz para que puedan ejecutar una serie de tareas. Cuando hablamos de los asistentes de voz, hay que diferenciar ‘dónde habitan’, principalmente en smartphones y en altavoces (ej: Amazon Echo). Si tuviésemos que mapear ‘el ecosistema de voz’ tendría esta estructura planteada por VoiceLabs:

2. mapa-busqueda-por-voz-IMG-2.png

Fuente: Mapeo del ecosistema de los asistentes de voz. ‘The 2017 Voice Report by VoiceLabs’

A través de éste mapeo se ve cómo el hardware ‘encapsula’ la experiencia del consumidor; el software de inteligencia artificial interactúa con los usuarios; estos asistentes pasan a formar parte de ‘experiencias’ en aplicaciones de terceros, ayudando a las marcas a conectar con los consumidores a través de sus servicios; y finalmente, los servicios de ecosistemas que permiten reforzar las aplicaciones para proporcionar valor a todos.

El éxito de estos asistentes está pasando por sus mejoras en la inteligencia artificial que usan (principalmente el procesamiento del lenguaje natural, NLP), el aprendizaje automático (Machine Learning), la infraestructura a nivel de telecomunicaciones, smartphones más potentes y computación en la nube.

  1. Dónde están haciendo los esfuerzos estos asistentes virtuales para diferenciarse

Según VoiceLabs, el foco de Google consistirá en dar respuesta a preguntas sobre conocimiento general; Amazon se centrará en el comercio; Google y Microsoft podrán sobresalir a la hora de presentar información sobre correo electrónico, contactos y calendario (productividad personal); Microsoft tendrá la oportunidad de destacar en juegos de azar; Google y Amazon lucharán por la televisión de ‘hands-free’ y la domótica; y Apple, apostará por AirPods y AppleTV. Lo que buscan todos estos players es una especialización para ofrecer una experiencia, no un soporte físico.

  1. De dónde tiran los Asistentes de Voz para poder presentar la información

De cara trabajar optimizaciones de contenido es relevante saber de dónde tiran los asistentes de voz principales para presentar sus resultados:

  • Alexa: obtiene la información general de Bing y la información local de Yelp. Amazon en el 2015 integró Yelp para dar respuestas locales a Alexa, por este motivo Amazon Echo puede servir información relativa a establecimientos (restaurantes y locales).
  • Google Assistant: obtiene la información de Google y la información local de Google My Business.
  • Cortana: tanto la información general como la información local la obtienen de Bing, Bing Places for Business y Yelp.
  • Siri: las búsquedas en Siri, búsqueda en iOS y Spotlight en Mac utilizarán Google (a partir de septiembre de 2017). Los resultados de imágenes web seguirán siendo servidos por Bing, y el vídeo será Youtube.
  • DurOs: información procedente de Baidú.
  1. Cómo se están comportando los consumidores y el mercado

Datos de eMarketer muestran un mercado claramente millennial en el proceso de adopción y consumo de los asistentes virtuales.

3. consumidor-asistente-virtual-IMG-3.png

Fuente: Alexa, Say What?! Voice-Enabled Speaker Usage to Grow Nearly 130% This Year

Sin embargo, son las siguientes generaciones (Generación Z) las que marcarán el consumo de éstos. En el caso de Estados Unidos, actualmente 1 de cada 3 usuarios dentro del rango considerado como generación Z, utiliza la búsqueda por voz o los comandos de voz en el último mes a través de su smartphone. En el caso de Europa, es la Generación Z la que está marcando el consumo.

3. consumidor-asistente-virtual-IMG-3.png

Fuente: 1 in 3 Gen Z in North America Using Voice Command on Mobile

Cómo están utilizando los usuarios las búsqueda por voz, según datos del asistente Hound, está muy equilibrado el consumo de información local (22%), entretenimiento (21%), información general (30%) y asistente personal (25%), llegando a representar un 52% la búsqueda por voz para recuperar información.

5. voice-query-Hound-IMG-5.png

Fuente: Internet Trends 2016 – Code Conference. Mary Meeker, junio 2016

En el mercado norteamericano se estima que 60,5 millones de norteamericanos usarán al menos una vez al mes el asistente de voz de su dispositivo (esto supone case un 130% más con respecto al año anterior), siendo los usuarios con edades entre los 25 y 34 años lo que mayor uso harán (en el entorno de entretenimiento).

La cuota de dispositivos (en Estados Unidos) donde tienen presencia estos asistentes de voz se distribuye con un claro líder, Amazon Echo con un 70,6%, Google Home 23,8% y otros players con 5,6% (Lenovo, LG, Harmon o Kardon). La popularidad de Amazon Echo, está haciendo que Amazon esté liderando la búsqueda en este mercado.

5. voice-query-Hound-IMG-5.png

Fuente: The 2017 Voice Report by VoiceLabs

El proveedor de herramientas de marketing online BrightEdge entrevistó 252 comercializadores/vendedores (‘marketers’) digitales de marcas que forman parte de del Top 500 Fortune (B2C y B2B), el interés de esta entrevista era entender cómo los vendedores se están preparando en adaptarse al uso de la inteligencia artificial, la búsqueda por voz y la búsqueda Local.

Algunos de los aspectos relevantes de esta entrevista fueron la adopción de los asistentes de voz dentro de una estrategia de marketing, y el desarrollo de contenido pensando en local:

  • Un 31,35% consideraba que la búsqueda por voz era ‘the next big thing’, seguido de la optimización móvil (26,89%)
  • Sin embargo, un 61,90% no consideraba la posibilidad de integrar la búsqueda por voz en su estrategia de marketing.
  • Un 70,24% consideraba algo importante o muy importante crear y optimizar contenido para mercados locales.
7. Survey-results-brightedge-IMG7.png

Fuente: 2017 - Future of SEO and Content Marketing Survey. Brightedge
 

¿Dónde están las oportunidades de Optimización del Contenido para dar respuesta a un asistente en voz?

Dentro de una estrategia de optimización orgánica, dos de los focos donde se deberían centrar las marcas en su proceso de optimización de cara a los asistentes que se utilizan en smartphones son: local y fragmentos destacados (featured snippets), ver otros puntos de control SEO aquí, aquí y aquí.

Tanto los fragmentos destacados como presencia local, deberían ser aspectos a trabajar por la marcas de cara a potenciar la visibilidad de sus contenidos ya que éstos son servidos por Google Assistant y Cortana en una búsqueda por voz, y ahora, también por Siri.

8. fragmentos-enriquecidos-IMG-8.jpg

Fuente: Rating the Smarts of the Digital Personal Assistants

  1. Fragmentos destacados (Featured Snippets)

Estos fragmentos tienen el beneficio de activar búsquedas de voz, en Google hay tres tipos de fragmentos destacados (featured snippets): párrafo, lista (números o en bullets) o en tabla (los más comunes son los de párrafo). Qué es lo que hace que Google ‘premie’ el contenido de un sitio con este formato, en el whitepper ‘How to get more featured snippets’ se analizó qué factores de marcado tenía el contenido sobre aquellas URL’s que tenían presencia en los resultados a través de fragmentos enriquecidos, las principales conclusiones a las que llegaron:

  • Había una frecuencia de presencia de fragmentos enriquecidos de hasta un 25% para aquellas búsquedas que tenían más de 6 palabras.
  • El contenido venía marcado con <table>, <ol>, <ul> o listas.
  • Uso exacto de la keyword en la etiqueta <title>.
  • Presencia de la keyword de búsqueda en las etiquetas de encabezado <h1> y <h2>.
  • Marcado con schema.org.
  • Tiempo de respuesta y velocidad de carga.
  • En menor medida: métricas de autoridad basadas en el enlazado, la actividad social, el número de imágenes o el número de vídeos.
9. busqueda-voz-img1.jpg

Ejemplo: Búsqueda con Google Now a la izquierda y con Google Allo a la derecha ‘Cómo hacer una tortilla de dos huevos’, ambas utilizan el asistente Google Assistant y tienen como respuesta un fragmento enriquecido en forma de ‘Lista’

La presencia de este tipo de resultados suele corresponder con la complejidad de la pregunta, con carácter general, Google es capaz de responder a través de su gráfico de conocimiento con 1 de cada 5 consultas, y la tipología de consultas que resuelven tiene que ver con nombres, datos numéricos, lugares y cosas.

En el caso de Bing, también tiene incorporada esta funcionalidad desde 2015 (donde el usuario puede evaluar la relevancia del resultados) y desde junio de 2017, el usuario tiene la opción de ampliar el resultado a través de ‘ver respuesta completa’.

Ambos buscadores están buscando la forma de ‘premiar’ contenidos a los que no llegan a responder directamente, y por tanto, las marcas deberían ver una oportunidad de optimizar éstos.

  1. Local

Entendiendo que parte de la evolución que pueden tener los asistentes de voz a la hora de integrarse con grandes verticales donde se da respuesta a aspectos locales (ej: Yelp), opiniones (ej: booking.com), etc, es importante observar esta evolución para trabajar la presencia de la marca en estas plataformas, ya sea directamente y/o invitando a los usuarios a la participación en ellas, lógicamente, este impacto y visibilidad vendrá marcada por el sector en el que se opere (B2B vs B2C).

La propensión a la búsqueda local como hemos visto anteriormente, representa un comportamiento de búsqueda por voz lo suficientemente relevante como para que negocios con establecimientos físicos desarrollen su presencia. Google estima que un 76% de las personas que realizan una búsqueda local en su Smartphone, visitan un lugar físico en un plazo de 24 horas y el 28% de esas búsquedas, resultan en una compra; o que un 33% de las búsquedas que se realizan a través de un smartphone, están relacionadas con la ubicación, sin duda, estos datos son los suficientemente relevantes como para que las maracas establezcan una estrategia clara y robusta.

10. busqueda-voz-img2.jpg

Ejemplo: Búsqueda ‘restaurantes tailandeses cerca de aquí’, a la izquierda resultado de Google Assistant con resultados de MyBusiness y a la derecha, resultados de Siri para la misma consulta con resultados procedentes de Yelp y Foursquare.

Si como negocio estás en una etapa de entendimiento sobre cómo se debe plantear un proceso de optimización Local, es recomendable que consultes el estudio ‘2017 Local Search Ranking Factors’ donde se analizan los aspectos posibles que influyen a nivel de factor ranking. El esfuerzo de desarrollo y optimización local los centra en cuatro aspectos necesarios: on site técnicos (dentro del sitio web), contenidos, estrategia de enlazado y citaciones. Parte de la construcción de estrategia local robusta deberá pasar por el proceso de captación e incentivación de reviews para el negocio (tanto para su presencia en buscadores como en RRSS).

  1. Qué tipo de herramientas pueden ayudar para saber de qué hablan los usuarios

Detectar la relevancia de palabras clave y sus triggers asociados (qué ver/qué hacer cerca de aquí, las dónde están ‘las mejores ofertas’, ‘buenas opiniones de’, comprar, reservar, etc pueden llegar a identificar las términos relevantes que pueden estar usando los usuarios y están asociadas a diferente etapas de intención. Así mismo saber donde se produce la búsqueda por voz ayuda a terminar potenciales términos asociados a la acción.

Por qué es relevante contar con herramientas que ayudan a capturar la intención de búsqueda long tail, básicamente porque a través de éstas nos va a ayudar a identificar potencial búsqueda long tail originada en búsqueda por voz.

Identificación de triggers de los productos/servicios a través de herramientas de encuestas (Sruvio, Surveymonkey, Google Formularios, Zoho Survey o Polldaddy, y/o a través de los equipos de atención al cliente; herramientas comerciales de long tail como Soovle.com o Answerthepublic.com, y las redes sociales (por ejemplo, a través de la búsqueda avanzada de Twitter en la opción ‘cercad de este lugar’, se pueden identificar de qué están hablando los usuarios, entender cómo se expresan y los términos que utilizan) .
 

¿Hacia dónde vamos?

Si bien las propias plataformas hablan de encontrarse en los inicios del potencial de la búsqueda por voz, uno de los aspectos que está marcado la diferencia, es como éstos están entendiendo el contexto y responden a preguntas que requieren de preguntas previas. En esta ‘lucha’, parece que Google está siendo el que mejor está resolviendo a este tipo de interacciones a través de preguntas relacionadas.

11. pablo-escobar-img3.jpg

Ejemplo de cómo Google Assistant me presenta un resultado (a la izquierda) y a continuación si se quiere saber más información sobre esto, el asistente entiende el contexto y da respuesta a la segunda si precisar por el nombre [Pablo Escobar]

Este tipo de estrategias basadas en estar presente en las diferentes etapas de intención del consumidor, muy probablemente se puedan ver alteradas en fases orientas a la acción/conversión, principalmente por la integración en las que se encuentran inmersos los diferentes players (por ejemplo, Google está realizando su integración con proveedores de música y audio, hogar inteligente, entretenimiento, juegos y servicios en streaming).

12. google assistant restaurante.png

Ejemplo: Consulta a través de la aplicación Google Allo: 1. Dónde está un restaurante [‘dónde está el restaurante kyoto’] y 2. intentar hacer una reserva [‘reserva en el restaurante kyoto’]. Esta última acción no la puede ejecutar porque actualmente no tienen ningún proveedor que pueda dar respuesta. En el caso de Siri, si podría, ya que tiene realizada la integración con OpenTable.

Finalmente, otro de los éxitos de estos asistentes de voz, podrá venir marcado en cómo son integrados en Apps de terceros (y su impacto en el internet de las cosas –IoT-), a medida que estos asistentes de voz tengan una mayor interconexión en diferentes ecosistemas de dispositivos, harán a las plataformas más fuertes (por ejemplo, parte de la estrategia de Amazon con Alexa, es que este asistente se extienda más allá de los altavoces).

Siri utiliza Sirikit para realizar las integraciones (los servicios que pueden incluir son envío de mensajes en Apps de mensajería, llamadas de voz sobre IP, pagos, ejercicios, búsqueda de fotos o pedir un servicio –pedir un taxi-) y requiere de una definición de contexto para que se vaya respondiendo a las posibles preguntas que haga el usuario (trabajar el mapeo de la conversación); en el caso de Alexa, usa Alexa Voice Service (AVC) y Alexa Skills kit para añadir capacidades; Cortana también utiliza Cortana Skills kit para la incorporación de nuevas capacidades.

13. Alexa Skills.jpg

Fuente: Nivel de adopción de Alexa Skills en Apps de terceros. The 2017 Voice Report by VoiceLabs

En el caso del gigante chino Tencent, su asistente de voz Xiaowei quiere ser el backend de la AI para desarrolladores de terceros y proveedores de contenido. A través de su plataforma Skill los desarrolladores pueden aprovechar el SDK de Xiaowei para conectar sus propias aplicaciones y contenido. La entrada de voz de los usuarios se canalizará a través de Tencent Cloud, que hace todo el procesamiento y da la respuesta apropiada. La potencia de este asistente viene de la mano del ecosistema que tiene Tencent (acuerdos con compañías de transporte, películas, música, deportes, literatura y redes sociales).


ESTHER CHECA. Directora de Innovación, T2Omedia
Síguela en Linkedin y Twitter

 

BESTSELLERS