BKF-FI : Recherches en open sources sur le web

RECHERCHES INFORMATISEES EN OPEN SOURCES (Osint)

Le cabinet possède une expérience avérée en matière d'exploration des sources ouvertes, pour parler simple, d'exploration du web en profondeur selon une démarche relevant de l'investigation en vue de produire du renseignement.

100% des informations recueillies figurent sur le web et sont donc en accès libre pour tous. Mais seules 90% - en termes d'ordre de grandeur - des informations indexées par un crawler de type Google sont a priori accessibles ou dénichables par un requêteur lambda d'autant qu'aucun moteur de recherches ne fournit les mêmes résultats et sont donc de facto complémentaires. 10% sont pratiquement introuvables sans la mise en action d'outils spécifiques couplés à une stratégie éprouvée de requêtes.

Les recherches informatisées sont fondées sur la mise en œuvre d'un logiciel spécifique couplée à une stratégie de requêtes élaborées s'appuyant sur plus de deux décennies d'expérience de questionnements de grandes bases de données "plein texte" et sur les fondamentaux du référencement et de l'indexation sur l'internet. Les recherches et surveillances sur les réseaux sociaux en particulier Facebook et Tweeter relèvent également d'une technicité logicielle particulière.

La stratégie des requêtes est mise en œuvre en combinant les informations déjà disponibles sur le ou les entités ciblées puis élargies à celles qui sont progressivement découvertes. Des requêtes à caractère strictement technique sur les moteurs de recherches sont également mises en œuvre autant que de besoin pour sonder les contenus profonds indexés des crawlers qui ne s'affichent jamais à la vue d'un utilisateur lambda. Les informations spécifiques disponibles sur les codes sources des pages internet sont exploitées tout comme la consultation des archives du web. Par ailleurs le cabinet questionne les grandes bases nationales, françaises ou étrangères, disponibles tels par exemple les registres du commerce français ou étrangers.

Les informations recueillies mises en lien et en rapprochement permettent de réaliser un environnement du ou des sujets d'observation ou d'obtenir un paysage "du dit sur le web" constituant une véritable "intelligence" du sujet. L'osint est le pilier du renseignement stratégique et opérationnel moderne pour servir différents domaines d'application: le marketing, la recherche documentaire, l'investigation, l'Intelligence économique et même la sécurité nationale par les services d'Etat. Le cabinet compte un grand nombre de clients pour cette spécialité qui est commandée généralement dès la prise en compte d'un dossier.

REQUETES TECHNIQUES. De quoi s'agit-il ? : Extrait de l'article de 01NET.ENTREPRISES :

[Au siège de Google USA] "Chaque jour, la même scène se répète : des visiteurs restent plantés au milieu du hall d’accueil, comme hypnotisés. Au lieu de se diriger vers les hôtesses, de se présenter et de récupérer un badge, ils demeurent ainsi figés plusieurs minutes, médusés par l’immense écran suspendu derrière la réception. Dessus,défilent très lentement, dans toutes les langues, les requêtes formulées sur Google en temps réel par les internautes du monde entier. Fascinant ! Nous sommes dans GooglePlex, l'immense siège social californien du célèbre moteur de recherche.

Si les visiteurs restent prostrés devant cet écran, c’est qu’il réveille le côté voyeur de chacun d’entre nous. Certaines des requêtes sont parfois sibyllines. Mais les résultats, toujours surprenants. Tapez, par exemple, «intitle:index.of paye.xls » , et vous accédez à des fiches de paie ; « inurl:indexframe.shtml Axis » affiche l’image en temps réel de centaines de caméras de vidéosurveillance ; quant à la requête « « téléphone * * * » « adresse * » « e-mail » intitle : " curriculum vitae " » , elle récupère toutes sortes de curriculum vitæ, d’adresses et de numéros de téléphone. La liste pourrait continuer indéfiniment. Car Google, de même que beaucoup de moteurs de recherche, accepte des requêtes par mots clés et reconnaît des opérateurs aussi avancés que ceux des bases de données. Ainsi, un filtre comme « site : » restreint la recherche à un nom de domaine précis. Un autre comme « filetype : » ne remonte qu’un type de fichiers particulier. Ne reste plus alors qu’à être créatif. .../..."

Source: Accéder ici

Le cabinet met en œuvre ses recherches en standard sur deux langues de base, le français et l'anglais mais adaptent ses requêtes à l'italien et l'espagnol au besoin. Le cabinet couvre également les recherches en langue chinoise à quatre mains avec l'assistance de notre partenaire native privilégiée Ying (experte assermentée auprès des tribunaux).

Le cabinet réalise également pour les dossiers complexes et d'intérêt majeur, ou la simple demande, des schématisations relationnels des résultats d'OS.

LES RECHERCHES OS SONT-ELLES UNE ACTIVITE TRIVIALE ?

Il est parfois avancé que rechercher sur Internet est une activité facile à la portée de tous. Il n'en est strictement rien, hormis pour les 90% d'informations facilement accessibles.

Fondamentalement à la base, toute recherche repose sur une stratégie, beaucoup d'expérience en matière de recherches en plein texte, des "tips and tricks" innombrables, des connaissances techniques sur le référencement et l'indexation du web, des répertoires "de favoris" bien garnis et des logiciels d'appui d'exploration et de surveillance. Bref un capital corporel et incorporel important pour trouver ce que les autres ne réussissent pas trouver.