outils de recherche - articles archivés

Abonnez-vous au flux RSS feed pour cette catégorie uniquement

 

Je vous ai parlé dans un de mes billets du dossier auquel j’avais participé dans Archimag de juillet/août intitulé “l’infodoc par ceux qui la font”.

Tout à fait par hasard -ou plutôt non, grâce à la découverte du site 123people dont je vous parlerai ensuite -, j’ai découvert que le site des cadres territoriaux La lettre du cadre avait le 1e août fait un commentaire intitulé “regards de documentaliste” sur le dossier.
Comment ne pas être très heureuse d’y lire que mon blog est excellent ? Mais attention ! Un compliment entraîne toujours de travailler plus pour continuer à le mériter. Bref, c’est flatteur et encourageant. Merci à son auteur.

En tout cas, je vous conseille vivement d’aller regarder le site et plus particulièrement sa partie “documentation”… une vraie mine.

Et pour en revenir à 123people, j’ai découvert ce moteur de recherche de personnes par le biais de Brainsfeed qui signale le lancement de versions limités à certains pays européens tels que la France, l’Allemagne, le Royaume-Uni.
Je n’irai pas jusqu’à dire que la version française est réellement impressionnante car pour ce qui me concerne je me retrouve avec trois photos… dont une seule est la vraie et les courriels cités sont tous faux et non, je ne suis pas la GLB de Facebook, juré car je ne suis pas du tout une fan des émissions de télé. Bref les homonymies perturbent un peu les choses et parfois les Geneviève citées ne sont pas du tout Le Blanc.

En tout cas, c’est un outil pour retrouver des informations sur quelqu’un, mais avec attention !

Toujours par rapport à mon nez plongé dans le livre “la veille stratégique sur l’internet” par Henry Samier et Victor Sandoval paru aux éd. Hermès Sciences Publication en 2002 que je vous ai présenté dans mon billet d’hier intitulé : un livre sur la veille stratégique, voici la partie promise sur les sources d’information.

Les auteurs s’appuient sur la traditionnelle liste “repérer, identifier, organiser, classifer et cibler”.
J’ai mis pour mémoire ce qu’ils en disaient à la fin de ce billet.

Mais il y a trois points intéressants dans la partie du livre à propos des sources d’information
==> leur localisation
==> leur surveillance électronique
==> un tableau de bord comme outil

_______________________

LOCALISATION des SOURCES d’INFORMATION

Pour les quatre logiques de recherche [géographiques, thématiques (annuaires), indexales (Google, Altavista) et méta-indexales (Metacrawler)]
et selon les caractéristiques des moteurs de recherche [généralistes : volume des données, modes de recherche possibles, formulation des résultats, pertinence des 10 premières réponses sont les points qui permettent de juger de la pertinence d’un moteur et scientifiques : la pertinence est calculée par l’analyse de l’algorithme mathématique utilisé par le moteur et par le temps de réponse en fonction du volume de l’index auxquels s’ajoutent la puissance de recherche en mode expert et la richesse du contenu (gopher, wais, web, news, FTP)] (cf mon commentaire)
les auteurs proposent une méthode intéressante (appelée XFind).
Pour présenter cette méthode, ils s’appuient sur quatre moteurs :
Alltheweb, le plus ergonomique
Altavista, qui a le plus d’options
Google, pour son volume le plus important
Nothernlight, le plus fourni en sources.
et donnent pour chacun à chaque mode opératoire la façon de procéder.

Voici les quatre modes opératoires de cette méthode originale

Les deux premiers modes doivent être rélisés au début de la recherche, les deux suivantes permettent d’affiner et de compléter les recherches.

1e mode, une logique de détection et non de recensement pour trouver rapidement, les premières informations figurant dans les 10 à 30 premiers résultats en moins d’une seconde
Il s’agit de rechercher une partie de la phrase dans le titre d’un document ou de l’URL

2e mode, trouver des adresses
Là encore le but est d’obtenir un maximum d’information en moins d’une seconde dans ls 5 à 35 premiers résultats

3e mode, trouver des sites qui pointent un lien sur un autre site
Ceci afin de trouver un maximum d’informations en un minoimu de temps (dans les 50 à à 200 premiers sites obtenus
Sur les 4 moteurs retenus, seuls Nothernlight ne le permet pas

4e mode, extraire une page pertinente d’un site
pour éviter de perdre son temps à chercher une page sur des sites importants

_______________________

SURVEILLANCE ELECTRONIQUE des sources d’information
dans le cadre d’une VEILLE

Les auteurs fournissent quelques conseils en la matière

– avoir un moteur par onglet (4 à 10 maximum)
– structurer sa requête
bien choisir ses mots clés / tester / enrichir et valider les expressions de recherche (équations)
– détecter les sites noeuds
– détecter les carnets d’adresse pour se relancer
les compiler et les hiérarchiser (jour/hebdo/mensuel/trimestriel) pour construire son carnet des adresses à surveiller
– détecter les experts du domaine

_______________________

un OUTIL TABLEAU de BORD

Il faut en faire un par thème (concurrence, marketing, experts)…
Voir les tableaux faits p. 58 et 61
Ceci pour mémoriser
. qui est surveillé
. pourquoi (objectif)
. comment (mots clés
. par qui (nom du / des veilleurs)
. pour qui
. niveau de surveillance (fréquence (ex. hebdo), date de transmission de l’info. (ex. tous les lundi)
. localisation des résultats (mail, BdD de veille, …)

Ces critères sont remplis en ligne pour informer par site surveillé.

Les auteurs estiment qu’une PME a en général 7 à 13 tableaux de bord.

_______________________

A propos des sources d’information, B.A. BA rappelé

Trois types d’informations
– les informations blanches, informations publiques
– les informations grises (nécessité de connaître l’url pour les approcher)
– les informations noires, informations protégées

Trois types de sources
que les informations soient technologiques, financières, économiques, juridiques, concurrentielles ou réglementaires.
– les institutions,
– les entreprises,
– les groupes d’opinion

WikiBuddy cherche simultanément dans Wikipedia, wikiHow, Wiktionary, WikiAnswers, Wikmedia, Wikinews, Wikibooks, Wikiquote, Wikispecies, Wikisource, Wikitravel…

Inutile de vous le dire : Wikipedia, wikipedia, et encore wikipedia… mais enfin cela permet peut-être d’encourager les autres que l’on finit par dénicher en fonction de leurs ressources

Par contre dans le bas de la page d’accueil (genre Google…), 19 possibilités de relancer sa recherche par des moteurs plus classiques, plus connus, moins connus..

Régulièrement, lorsque je veux affiner une recherche ou lorsqu’une recherche n’a pas aboutie, j’ai l’habitude de faire une recherche sur Google par le biais des images.
Non pas que je voulais une illustration mais parce que parfois les sites signalés par ce biais ne le sont pas avec la même interrogation web.
Et puis bien sûr, parfois je veux trouver quelques illustrations.

Mais ma curiosité a été interpellée lorsqu’un billet de Paperboard a signalé l’existence de Tineye

Sur ce site, il est possible de donner l’adresse d’une image ou d’une photo et de retrouver ainsi les différents sites qui l’utilise. (Voir en exemple une de mes pages de mon site personnel où une illustration du battage de la soie en Chine trouvée sur Wikipédia est en fait une partie tronquée d’une image plus grande)

Pour l’instant l’utilisation de cette possibilité est en version bêta. Il faut donc s’inscrire pour demander une invitation et pouvoir ainsi utiliser cette version. Ce que j’ai fait et ne regrette pas.

_________
source :
http://www.paperblog.fr/901788/tineeye-une-image-pour-trouver-une-image/

J’ai trois navigateurs sur mon ordi :
– Firefox (mon basic),
– Opera (mon autre basic),
– Explorer (dont je me sers très rarement)

Pourquoi tant de navigateurs sur un malheureux ordi ?
Parce que pour les présenter à ses étudiants ou à son public, il vaut mieux savoir de quoi l’on parle.

L’installation d’Opera m’a permis de le pratiquer et de découvrir ses avantages :
1. permettre une page d’accueil avec l’icône de ses sites les plus usuels
2. fermer le navigateur sans perdre tous les onglets ouverts
Mais dorénavant Firefox permet aussi de mettre des icônes de sites dans la barre d’outils et propose au moment de sa fermeture de conserver ou pas les onglets ouverts.
A mes yeux et pour mon utilité Opéra a donc perdu une partie de son charme.

En conséquence, je pense remplacer Opera par Flock 2.0, un navigateur axé sur les réseaux sociaux et basé sur Firefox 3. Il est disponible pour les systèmes Windows, Mac et Linux.
La version 1.0 date de quelques mois seulement et sa version 2.0 est en encore en version bêta

Pourquoi ce projet ? Histoire de voir. Projet de rentrée. Je vous tiendrai en courant …car n’étant pas encore partie, je ne suis donc pas encore rentrée ;-))))

Quant à Safari, cinquième navigateur il est utilisé sous Mac. Je ne peux en parler car lorsque je travaillais sous Mac, Explorer pour Mac fonctionnait encore.

AllPlus, qui extrait ses résultats de Google, Ask, Yahoo et Live.
Possibilité de chercher par Web / News / Images / Video /Blogs
Dans une colonne spécifique, classement des résultats par formes d’écriture et présentation par graphs.

Conclusion, pas mal !

Ah comme c’est rageant de devoir chercher dans un site ce qui pourrait fournir une idée de la date de réalisation, le code source, une actualité, une référence, …
N’oublions pas qu’une information non datée n’a pas de valeur. Si les webmestres de tous genres voulaient bien s’en souvenir !

Voilà que Google vient à notre secours par le biais de Googlebot. C’est ce que nous explique Les-Infostratèges.
Sous réserve que la page concernée n’ait pas plus d’une année d’ancienneté, mais c’est déjà cela.

Il a le mérite de rassembler beaucoup d’informations (connues, certes) dont – entre autres – les moteurs & métamoteurs de recherche
C’est la page “guide” du blog Realclic

Il s’agit de Searchcrystal

Il présente le résultat sous forme graphique, succession de cercles représentant les moteurs. Plus les url sont proches du rond central plus leur place est importante dans les résultats. Cela permet de voir par quel moteur a été trouvé le site.
Et l’on peut spécifier un type de recherche : web, images, videos, news, blogs, tags, mashup, wikipedia.
En fonction du type déterminé, Searchcrystal déterminera les moteurs les plus efficaces.

Vous pourrez également
– envoyer votre résultat de recherche à vos amis et également importer le graphique sur votre blog
– étirer ou rétrécir les cercles afin d’y voir plus clair
– voir le positionnement du résultat dans les moteurs en positionnant votre souris sur le petit logo triangulaire devant le résultat

_____________________
sources
http://tweeby.com/feed.php?y=2007&m=07&d=14
http://www.realclic.com/blog/?p=28

Une étude scientifique menée par le métamoteur Dogpile avec les étudiants de l’Université technologique du Queensland et l’Université de l’Etat de Pennsylvanie a mis en exergue les différences de résultats entre quatre moteurs majeurs : Google, Yahoo, Windows Live et Ask.
Elle est résumée sur le Journal du Net.

Ainsi,

A partir des 19 332 requêtes (saisies sur chacun de ces moteurs), plus de 770 000 résultats ont été étudiés. Sur ces résultats, seuls 0,6% – c’est-à-dire 4 955 – se sont répétés sur les quatre moteurs et 88,3% – soit 685 432 – sont restés propres à un seul moteur.

Qui a dit que les documentalistes ne serviraient plus à rien ?

source : le blog de l’EBSI

« Previous PageNext Page »