Lo importante es saber buscar
Google es el principal motor de búsqueda, cuenta con más del 70% del mercado, seguido de lejos por Bing, Baidu, Yahoo! y Yandex. Su principal objetivo es indexar la mayor cantidad de información y para ello opera según tres pasos: Rastreo, indexación y publicación.
El rastreo es el proceso en el que tratan de descubrir qué páginas web, videos, bases de datos públicas, imágenes y otros contenidos se encuentran disponibles en Internet.
Actualmente no existe ningún registro central que proporcione información sobre qué páginas web existen, por ello es necesario buscarlas constantemente y añadirlas al listado de páginas conocidas. Esto se puede hacer de diferentes formas. El propietario de un sitio web puede facilitar una lista con sus páginas, esto se conoce como sitemap. También es posible que los proveedores de alojamientos web soliciten que se rastreen las páginas nuevas o actualizadas.
Los elementos encargados de encontrar páginas web públicas se denominan rastreadores, estos se encargan de analizar las diferentes webs y seguir los enlaces que contienen transmitiendo los datos a los servidores de Google.
Se denomina indexación al proceso en el cual se analiza y cataloga el contenido de una página web. Se detectan sus imágenes, videos, etc. Toda la información se guarda en las bases de datos de Google formando un índice.
El último paso es la publicación de los resultados, y este ocurre cuando un usuario final realiza una búsqueda en la barra del buscador de Google. Los algoritmos de búsqueda han ido evolucionando a lo largo de los años con el objetivo de proporcionar unos resultados más precisos y de forma cada vez más rápida.
Es en este último paso donde entra el usuario final, el que se encarga de escribir qué es lo que quiere encontrar. De nada sirve tener un algoritmo increíblemente potente si el usuario no sabe especificar con precisión lo que quiere encontrar.
Google Dorking
Google Dorking o Google Hacking es una técnica que usa las búsquedas de Google para encontrar agujeros de seguridad en los distintos sitios web.
El propio Google ofrece una potente herramienta de interfaz gráfico de búsqueda avanzada que nos permite ser más exactos y obtener mejores resultados: https://www.google.com/advanced_search
Google Dorking se basa en estos principios usados en esta herramienta para obtener información sensible de los diferentes sitios web.
Existen diferentes bases de datos y herramientas que automatizan las búsquedas, un ejemplo podría ser exploit-db. Se pueden encontrar multitud de vulnerabilidades, algunas de ellas se exponen a continuación.
Servidores FTP expuestos
intitle:“index of” inurl:ftp
site:ftp.* index of /ftp/backup
Listas de emailsFind email lists
filetype:txt inurl:“email.txt”
ext:xls intext:NAME intext:TEL intext:EMAIL intext:PASSWORD
Contraseñas en Trello
inurl:https://trello.com AND intext:@gmail.com AND intext:password
inurl:“trello.com” and intext:“username” and
intext:"password"site:trello.com password
Conclusiones
Google Hacking permite encontrar una gran cantidad de información sensible. Esta técnica se utiliza de forma frecuente en OSINT (Open Source Intelligence). Lo más importante que hay que recordar es que toda la información que se encuentra es porque está públicamente accesible, por lo que es posible evitar estos fallos o vulnerabilidades. En los casos anteriores se refleja perfectamente este hecho. Un ejemplo claro es Trello donde se podría evitar el acceso a datos sensibles de dos formas: Haciendo uso de un tablero privado o directamente omitiendo esa información sensible.