Los motores de búsqueda son páginas webs que examinan un criterio de busca definido por un usuario y muestran un índice ordenado. Navegar en la world wide web (www) es a través de hiperenlaces. Los hiperenlaces son textos o imágenes en las cuales tienes que pulsar para ir a otro sitio.
Cualquier autor web puede enlazar a cualquier otro contenido en línea. A través de la práctica de vincular todos los usuarios de Internet ayudan a organizar la información en línea hacia una web de recursos interconectados.
El índice de contenidos
Es importante destacar que la Web no proporciona una índice centralizado que realiza un seguimiento de lo que esta disponible en la red. Los motores de búsqueda son por lo tanto los servicios más importantes para ayudar satisfacer la necesidad de navegación de los usuarios de Internet de forma más eficaz.
Hay diferentes tipos de motores de búsqueda. El motor de búsqueda más importante es el basado en rastreadores. Esto utiliza software (denominado “rastreadores” o “arañas”) para buscar lo que está disponible en línea e indexa sistemáticamente este contenido. La sofisticación y eficacia del rastreador determina el tamaño y
la frescura del índice, que son a la vez medidas importantes de un motor de búsqueda de calidad.
Los rastreadores de los motores de búsqueda
En términos simples, la araña / rastreador sigue cada enlace de una página, indexa las páginas y luego sigue los enlaces a esas páginas, y así sucesivamente.
La operación más importante que realizan los motores de búsqueda es emparejar lo que un usuario búsqueda y la información que le muestra el índice. Normalmente, la salida de este proceso de emparejamiento es una lista clasificada de referencias. Estos impactos normalmente consisten en un título, fragmentos de información e hipervínculos a
las páginas que la tecnología del motor de búsqueda ha determinado como posiblemente relevante.
Junto con los “resultados orgánicos” (es decir, las páginas encontrado por el motor de búsqueda), los motores de búsqueda colocan resultados patrocinados determinado por un proceso de licitación de palabras clave por los comercializadores. El proceso de emparejamiento para los resultados orgánicos son complejos y comerciales.
Los motores de búsqueda protegen su clasificación precisa mediante algoritmos como secretos comerciales. El PageRank que utiliza el algoritmo de Google es uno de los más famosos algoritmos de clasificación de búsqueda en la Web. Ese pagerank predice la relevancia de los sitios web en el índice analizando la estructura de enlaces en la Web (es decir, los tipos de páginas que enlazan
esa página).
Anteriormente escribí un artículo sobre búsquedas que os recomiendo leer -> Herramientas útiles en internet de google.
Que necesita un rastreador
Un rastreador necesita que se le facilite el trabajo. Por ello es importante utilizar recursos en tu página web tales como tener un fichero robots.txt y tener un mapa del sitio.
Robots.txt
Es necesario tener un fichero robots.txt en el directorio raíz del sitio web el cual facilita la labor del rastreador indicándole qué tiene que rastrear. Por ejemplo, esta página web tiene este fichero:
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Allow: /*.css$
Allow: /*.js$
Allow: /*.jpg$
Allow: /*.jpeg$
Allow: /*.png$
Sitemap: https://avertigoland.com/sitemap.xml
Este fichero le dice al robot que no rastrea la carpeta wp-admin puesto que no interesa que se rastree ni que se añada a ningún índice. Es la carpeta de adminsitración de la página. Permite además que se añadan imágenes .jpg, .jpeg y .png al buscador de imágenes. Y por último le indica a robot donde está el mapa del sitio, sitemap.xml.
Sitemap.xml
Este fichero es crucial. Es como las ramificaciones de un árbol, las ramas de un árbol. De forma sencilla (sencilla para el rastreador) permite que todas las páginas del sitio que están en ese fichero puedan indexarse en el buscador. Que luego se indexen o no es otra cosa.
Los sitemaps son archivos en formato xml en los que se proporciona información sobre las páginas, las imágenes, los vídeos y otros archivos de tu sitio, así como sobre las relaciones que hay entre ellos. Los buscadores, como Google, leen estos archivos para rastrear los sitios de forma más eficaz. Los sitemaps informan a Google de qué archivos de un sitio son importantes según el webmaster y, además, incluyen datos importantes sobre ellos.
Cookies y su importancia para posicionar una página
Hacer coincidir las necesidades de información del usuario con el índice incluye el análisis del contenido de los sitios web y el análisis de los datos de los usuarios. Los motores de búsqueda utilizan cookies para almacenar las consultas de búsqueda de los usuarios, hacer clic en el enlaces y más de forma individualizada en sus bases de datos durante largos períodos de tiempo.
Un motor de búsqueda “vertical” o especializado se centra en la búsqueda de un tipo específico de asunto, como viajes, compras, académico, artículos, noticias o música. Un “metabuscador” es un motor de búsqueda que no produce su propio índice y resultados de búsqueda, pero en su lugar utiliza el resultados de una o más motores de búsquedas. Un “directorio” es un repositorio de enlaces
clasificados en diferentes categorías. El Yahoo! directorio (ya desaparecido) y el proyecto de directorio abierto son ejemplos famosos.
Como añadir tu página a los principales buscadores
Los motores de búsqueda tienen páginas para que tu activamente envíes tu sitio web:
- Enviar página a google -> http://www.google.es/intl/es/submit_content.html.
- Enviar página a bing -> https://www.bing.com/webmasters .
[…] Los siguientes comandos pueden servir de ayuda y tienen como diana el fichero robots.txt (https://avertigoland.com/2021/06/motores-de-busqueda-anadir-tu-contenido-a-google/) del directorio […]
[…] appearing in searches. The following commands can be used as a help and target the robots file.txt (https://avertigoland.com/2021/06/search-engines-add-your-content-to-google/) of the root […]