3.2 Allons plus loin …
On va se concentrer sur les opérateurs qui fonctionnent avec Google. La plupart des opérateurs indiqués fonctionnent avec d’autres moteurs de recherche, mais nous ne les avons pas tous testés.
site: L’opérateur site: permet de rechercher uniquement sur un site Web particulier. Par exemple, on pourra rechercher ALAIN DELON site:lemonde.fr : seules les pages du site lemonde.fr seront renvoyées. Dans le même esprit, on peut exclure un site de la recherche. Ainsi ALAIN DELON -site:lemonde.fr recherche les mots indiqués mais en excluant les pages du site lemonde.fr. Attention, ne pas mettre d’espace.
intext: et allintext: L’opérateur intext: suivi de mots-clés recherche des pages dont les mots-clés figurent dans le corps de texte d’un article, et uniquement dans le corps du texte. L’opérateur allintext: suivi de plusieurs mots-clés fait la même chose, mais ici, l’ensemble des mots-clés indiqués doivent apparaître dans le corps de l'article.
intitle: et allintitle: L’opérateur intitle: se concentre cette fois sur la balise title; de la page. Il s’agit du titre de la page, c’est ce qui apparaît sur l’onglet du navigateur lorsque la page est affichée. On utilise intitle: et allintitle: comme précédemment.
inanchor: et allinanchor: Plutôt que rechercher les mots-clés dans le corps de l’article, on va cette fois les rechercher dans le texte d’ancrage. Un texte d'ancrage est un mot ou un ensemble de mots sur une page Web, sur lequel vous pouvez cliquer pour accéder à une autre page. En d'autres termes, il s'agit du texte visible sur lequel vous pouvez cliquer sur un hyperlien.
inurl: et allinurl: Normalement, vous avez compris : l’opérateur inurl: recherche les termes indiqués dans l’url de la page.
related: L’opérateur related: suivi du nom d’un site Web permet de rechercher des sites alternatifs au site indiqué.
define: L'opérateur define: permet de limiter les résultats de la recherche à la définition du mot-clé indiqué. En général, les résultats renvoient à des sites de référence ou proposant des définitions.
filetype: ou ext: (filetype et ext sont équivalents) Attention, on a là un opérateur assez redoutable ! Cet opérateur doit être suivi d’un type d’extension de fichier (pdf, doc, jpg, txt, …). Associé à un mot-clé, il permettra de trouver tous les fichiers incluant le mot-clé. On peut aussi l'associer à un site Web particulier avec l’opérateur site:
(...) Quand la requête commence à devenir complexe, ne pas hésiter à utiliser des parenthèses pour mettre un peu d’ordre et regrouper plusieurs parties ensemble.
# Le hashtag doit rechercher des contenus qui font le buzz, mais il est difficile d’apprécier la pertinence de cet opérateur
@ L’arobase permet de prendre en compte les social tags (balises pour les réseaux sociaux)
.. Cet opérateur (deux points) permet de faire des recherches entre deux valeurs numériques : code postal, prix, année. On l’utilise ainsi 2020..2022 par exemple.
cache: Cet opérateur, suivi d’un site Web renvoie la page en cache (ancienne version) enregistrée par Google
3.3 Quelques exemples
filetype:pdf “a. delon” -site:lemonde.fr : Cette requête renvoie des fichiers pdf contenant “a. delon”, mais exclut le site lemonde.fr de la recherche.
Remarque : On a volontairement indiqué “a. delon”, ce qui n’est pas la même chose que “alain delon”. Lorsque l’on fait une recherche sur une personne, il faut penser que le prénom est parfois indiqué avec uniquement son initiale. C’est parfois le cas dans des comptes rendus de réunion. Donc, il ne faut pas hésiter à tester cette option.
"alain delon" -nathalie site:lemonde.fr filetype:pdf : On cherche des fichiers pdf sur lemonde.fr contenant “alain delon”, mais pas “nathalie”.
" euuuh, il y a un problème avec Alain Delon ? "
Bah non, pourquoi, OK, un autre exemple :
filetype:pdf lemonde.fr “
mon_email@mail.com" : on recherche des fichiers pdf sur le domaine lemonde.fr, contenant une adresse mail donnée.
site:lemonde.fr -inurl:https : Cette requête recherche sur le nom de domaine lemonde.fr en excluant les pages qui comprennent https dans l’url. Pour le coup, on va obtenir les pages en http.
appartement (paris OR fontainebleau OR aubervilliers) -location : Dans cet exemple, on voulait simplement mettre en évidence l’intérêt des parenthèses …
On peut être un peu rusé et indiquer aussi … des symboles dans une requête :
site:linkedin.com "responsable" (☎ OR ☏ OR ✆ ) "paris"
dans le même esprit : “alain delon” (☎ OR ☏ OR ✆ )
D'autres exemples de requêtes peuvent être trouvés sur Google Hacking Database :
https://www.exploit-db.com/google-hacking-database
L’idée est simplement de s’en inspirer et les adapter.