Google es un buscador de palabras o frases en páginas webs colocadas en un índice. Mediante Google Dorks se pueden utilizar técnicas de hacker para rastrear sitios webs indexados en Google y de esta manera encontrar posibles vulnerabilidades en páginas webs. También se le suele llamar Google hacking, hacker a través de Google buscando aplicaciones con agujeros de seguridad en su configuración y códigos de ordenador en páginas webs que están, desafortunadamente, indexados en Google.
En este artículo voy a recopilar varias instrucciones para buscar en Google estas páginas webs con baja seguridad, así como otros criterios de búsqueda interesantes. Todas estas técnicas están permitidas puesto que cualquier puede hacerlas, aunque hay que utilizarlas con sentido y no ser proactivo creando amenazas a sitios webs vulnerables. Se trata de trabajar en resolver problemas, no en crearlos.
Nacimiento de Google Dorks
Se puede decir que Google Dorks nación en el año 2002 de la mano de un hacker llamado Johnny Long. Se trata de un hacker profesional e investigador durante años en seguridad informática. Es el fundador de Hackers For Charity (http://ihackcharities.org), una organización que brinda experiencia laboral a los hackers mientras se aprovechan sus habilidades para organizaciones benéficas que necesitan esas habilidades.
La búsqueda avanzada en Google
Existen múltiples posibilidades para ser más precisos a la hora de hacer una búsqueda en google, y parte de utilizar la búsqueda avanzada de google, https://www.google.com/advanced_search. Hay caracteres y símbolos comodines como AND, OR, NOT, y símbolos como ~ para buscar sinónimos, + para combinar dos palabras, “” para búsqueda exacta, * para carácter comodín.
Hay otros criterios muy útiles como:
"link:avertigoland.com"
Sitios webs que enlazan a tu página web. Cambiar la URL por la que queráis buscar.
related:NYtimes.com
Muestra sitios webs relacionados con el que estás buscando. Por ejemplo, si se trata de un periódico online, mostrará otros periódicos online que muestra noticias parecidas al que escribes como criterio de búsqueda.
weather:Vigo
Muestra información del tiempo del pueblo o ciudad que utilizas como criterio de búsqueda.
cache:paginaweb.com
Muestra la última versión en caché de una página web guardada en Google. Se trata de una captura de pantalla de la página tal como esta en una marca temporal. Es posible que la página haya sufrido modificaciones desde esa marca temporal.
Búsqueda de información de ingreso a sitios web
Veamos a continuación una serie de códigos para buscar en google y la explicación de lo que hacen. Señalar que, si obtenemos los datos de usuario y contraseña, aunque sean datos públicos que se ven en una búsqueda en Google, nosotros no tenemos permiso para acceder a la máquina que tiene esas credenciales. Así que solo tiene que tratarse de manera informativa, en forma de investigación, pero no se puede acceder a lugares a los cuales no tenemos permiso. Si aún así accedemos lo ideal es navegar utilizando una VPN.
filetype:xls username password email
Esta búsqueda muestra hojas de cálculo de Microsoft Excel que contienen las palabras nombre de usuario, contraseña y correo electrónico. Hay que tener en cuenta que van a aparecer un montón de formularios “plantilla” en blanco que no proporcionan información, sin embargo, también se puede encontrar documentos reales llenos de contraseñas y usuarios.
site:intext:"pass" ! "usuario" | "user" | "contraseña" filetype:sql -github
Esta búsqueda lo que hace es mostrar los resultados de una búsqueda en google de sitios webs donde vengan usuario o contraseña y para el tipo de archivos SQL (base de datos).
intitle:"index of" inurl:/backup
Busca directorios con copias de seguridad.
filetype:sql "MySQL dump" (pass|password|passwd|pwd)
Esto muestra los datos exportados de una base de datos MySQL donde se está buscando pass|password|passwd|pwd como palabras clave.
Cómo evitar que Google indexe un sitio web
Todos los códigos vistos anteriormente muestran información que está en un índice creado por el buscador Google. Como medida de seguridad para evitar esto es evitar que el robot indexador de Google indexe el sitio web, prohibiendo aparecer en búsquedas. Los siguientes comandos pueden servir de ayuda y tienen como diana el fichero robots.txt (https://avertigoland.com/2021/06/motores-de-busqueda-anadir-tu-contenido-a-google/) del directorio raíz:
Prohíbe que Google indexe el sitio web entero:
User-agent: Googlebot Disallow: /
Prohíbe que cualquier robot indexe un sitio web:
User-agent: * Disallow: /
Prohíbe al robot de Google indexar archivos específicos:
User-agent: Googlebot Disallow: /*.sql$
Prohíbe que el robot de google indexe una carpeta de un sitio
User-agent: Googlebot Disallow: /nombredirectorio/
Prohíbe que el robot de Google indexe una págoina en concreta del sitio web
User-agent: Googlebot Disallow: /confidencial.html
[…] i.e. plain text, and can be downloaded. In addition, you can find information about . See Google Dorks or how to use Google to hack for more […]