1 - Définitions générales

Connaissance ?

Nous empruntons la définition suivante à [Bachimont, 2004] : 

« Une connaissance est la capacité d’exercer une action pour atteindre un but ».

Nous adoptons cette définition pour indiquer qu’une connaissance est le corrélat d’une action possible et qu’un objet n’existe que parce qu’il est possible d’agir sur lui, y compris par la pensée.

Inscription de connaissances

Nous gardons l'idée qu'une connaissance peut donner lieu à des inscriptions dans l'environnement pour permettre sa transmissionn, son partage, sa réutilisation.

Ceci est particulièrement vrai lorsque ces inscriptions sont formelles, au sein d'un environnement informatique pour permettre de "représenter" les capacités d'inférence liées à ces connaissances.
Les connaissances peuvent ainsi être inscrites de manière particulière, on dit alors "représentées",  dans un environnement si tant est que cet environnement dispose d'un "interpréteur" permettant de passer de ces inscriptions à l'action dans le cadre d'un but bien défini. Il s'agit alors de l'approche proposée par les techniques de l'intelligence artificielle (voir module C217 de la emiage à ce sujet). La représentation choisie respecte une "forme" très précise permettant de démontrer qu'une reformulation (transformation syntaxique valides de formules) est équivalente à une démonstration mathématique en logique. C'est le "moteur d'inférence" qui réalise les reformulations et constitue un "démonstrateur" de théorème permettant de "dire le vrai à partir du vrai".

Dans le cadre de connaissances représentées formellement et disposant d'un mécanisme d'interprétation automatique, nous nous situerons clairement dans le cadre de l'Ingénierie des connaissances.

Dans le cadre de connaissances représentées informellement et nécessitant une interprétation qui pourra dépendre de la personne la faisant, nous nous situerons clairement dans le cadre de la gestion des connaissances.

Gestion des connaissances

Les notions d'information, de données et de connaissances

La notion d'information a été fondée théoriquement par Shannon (voir aussi wikipedia à ce sujet) : une information délivrée diminue l'ensemble des possibles à venir (notion de probabilité conditionnelle et d'entropie). On a un bon exemple pour "sentir" cette notion lorsque l'on veut réaliser un questionnaire (un sondage d'opinion par exemple sur l'intérêt de faire un cours sur la gestion des connaissances sous forme d'enseignement à distance). Les conclusions possibles étant "intéressé ou pas intéressé", dans quel ordre poser les questions préparées ? Il est clair qu'il faudra poser en premier la question qui apportera le plus d'information sur les conclusions (pour éviter d'avoir un questionnaire long et inutile). Par exemple, on évitera comme première question "Allez-vous souvent au cinéma", qui n'apporterait pas beaucoup d'information et on préférera sans doute une question du genre "Considérez-vous l'enseignement à distance comme une modalité d'apprentissage appropriée pour votre situation ?" qui apporterait une information complète si la réponse était non...

La notion de données est technique. Il s'agit d'éléments susceptibles de fournir des informations sur un domaine et par extension susceptibles de faire sens pour un agent interprétant. On parlera de donnnées géographiques, épidémiologiques, historiques, etc... Les données sont collectées pour être conservées à des fins d'exploitation (en tant que porteuses d'informations). L'analyse de ces données fournit des informations à un processus de classification par exemple. On peut ainsi recueillir des données observées sur des plantes dans la nature (forme, couleur, taille, type de tige, habitat, etc..) permettant ensuite à un enthomologiste d'identifier la plante (lui donner un nom). Ces données sont maintenant gérées dans des Systèmes de Gestion de Base de Données

Synthèse : Les données peuvent donc être collectées indépendemment de leur usage (par des personnes ou des procédés pour lesquels ces données ne constituent pas vraiment une information). Par exemple, des questionnaires sont remplis sur Internet par des utilisateurs d'un produit. Les données fournissent éventuellement des informations dans un processus de classification (en général). Par exemple, l'analyse des données permet de conclure sur telle ou telle préférence des utilisateurs. Ces informations peuvent faire sens pour permettre une action, du type "Si les utilisateurs sont en général incapables de se décider pour un achat après une seule visite d'un site marchand  Alors il faut leur permettre de revenir plusieurs fois en mémorisant leurs choix, l'historique de leur visite, etc.". Il s'agira alors d'une connaissance permettant l'action.

Gérer des connaissances ?

Comment dans ces conditions peut-on gérer des connaissances ? La réponse est multiple: puisque la connaissance nécessite d'une part une information et un agent interprétant capable d'agir car cette information fera sens pour lui, gérer les connaissances consistera d'une part à faire en sorte que les informations soient produites, gardées, disponibles, facilement accessibles aux agents interprétants "autorisés" et que les agents interprétants soient "formés", repérés et accessibles pour pouvoir interpréter ces informations et donc agir rationnellement en fonction d'un but clairement établi.

Il sera donc question d'ingénierie documentaire précisant comment organiser la documentation ou l'accès à la documentation sous une forme adaptée à la recherche de connaissances dans les documenst, d'ingénierie des données permettant d'accéder aux données sous forme pré-interprétée (indicateurs, tableaux de bord, etc.) mais aussi de formation des personnes, de guides d'utilisateur, d'organisation du travail facilitant la formation aux métiers, aux référentiels de l'entreprise, etc.

Puisque les connaissances sont liées à l'action et à la capacité de produire de nouvelles connaisances, on comprend bien toute l'importance qu'il y a d'une part à en faciliter le partage et la réutilisation dans le cadre d'une entreprise ou d'une institution dont il s'agira du capital le plus précieux sur lequel elle pourra s'appuyer pour continuer à progresser et à maintenair son leadership dans tel ou tel domaine. S'il s'agit bien d'un capital, il faut alors aussi savoir le protéger et l'on aboutit à une tension entre des efforts pour conserver, développer et partager ces connaissances à l'intérieur de l'entreprise et d'autre part les garder pour son développement propre et pour l'attractivité produite (les compétences, les savoir-faire sont là, gérés dans la continuité). L'inscription des connaissances se fait de plus en plus structurellement via le système d'information de l'entreprise et cette tendance est maintenant renforcée par la mise en place de mécanismes de recherche d'information sophistiqué que ce soit dans l'environnement public (internet) que privé (intranet).

Ingénierie des connaissances

L'ingénierie des connaissances consiste à orienter l'organisation et le système d'information autour de la notion de connaissances, c'est à dire autour de principes d'inférences (déduction, induction) permettant d'élaborer de nouvelles informations (ou de déclencher des actions) pouvant faire sens soit pour un mécanisme automatique (moteur d'inférence) soit pour un agent interprétant extérieur. L'ingénierie des connaissances va donc consister à mettre en place les procédures permettant de sélectionner les informations les plus "porteuses de sens", de les organiser autour de la sémantique qui leur a été associée a priori et d'associer des mécanismes d'interprétation automatique aux agents interprétant exploitant in fine le système ainsi développé. L'ingénierie des connaissances débouche sur une instrumentation technique permettant d'associer les inscriptions de connaissances sous une forme adaptée à des mécanismes d'interprétation prédéfinis (déduction ontologique, déduction anologique par exemple). Il y a alors une démarche non seulement documentaire mais explicitement associée à une "certaine manière" de faire du sens dans un but précis (conceptualisation, résolution de problème, diagnostic, planification).

Vérifions nos connaissances


 

2 - Ingénierie des connaissances : histoire courte

L'ingénierie des connaissances est le processus lié à :
Historiquement, on peut voir les choses selon le fil suivant :

General Problem Solver (GPS) Systèmes experts (Mycin, Xcon) Premières approches
structurées (Kads)
Méthodologie
systématique
(CommonKads)
1965 1975 1985 1995

C'est Alan Newell qui en 1982 a proposé le principe même de l'ingénierie des connaissances à l'occasion d'une communication restée célèbre "The knowledge Level, Artificial Intelligence, N°18, 1982". Le principe est illustré dans la figure suivante :

Knowledge Level Newell
Alan Newell a proposé une réponse de type "génie logiciel" pour le développement de systèmes à base de connaissances. Il s'agit d'exprimer dans un langage intermédiaire la représentation des connaissances utiles. Pour faciliter la réutilisation, les connaissances sont classées selon les buts du raisonnement, selon le type d'inférence attendu, etc. Ainsi défini avec un expert à un niveau de langage qui lui  est accessible, il suffit ensuite de "dériver" le système à base de connaissances (au niveau symbolique de la machine). Cette dérivation exploite le fait qu'il existe des principes invariants pour la résolution de problème, le diagnostic, la recherche d'information, l'aide à la décision, la planification, etc.

L'ingénierie des connaissances a connu son heure de gloire dans les années 1990 et retrouve un grand intérêt actuellement (les années 2000) avec l'émergence du Web Sémantique, de la gestion des connaissances dans l'entreprise et d'une manière générale par la communication sur l'économie de la connaissance (document réalisé par Jérôme Vicente du Lereps à Toulouse). Elle est maintenant presque toujours associée avec un projet de gestion des connaissances (il s'agit plus rarement de réaliser un système à base de connaissances devant fonctionner un peu comme un système expert).

 Vérifions nos connaissances


3 - Gestion des connaissances : histoire courte

La gestion des connaissances a pris ses lettres de noblesses dans les années 90 même si les civilisations les plus anciennes de Sumer archivaient et classaient leurs documents il y a plus de 4000 ans, organisant ainsi la conservation, le partage et la réutilisation des connaissances. Toutes les bibliothèques du monde ont poursuivi le même objectif, en organisant les inscriptions des connaissances sous des formes intelligibles mais nécessitant un apprentissage de la langue de représentation et un apprentissage permettant d'en tirer parti, c'est à dire une organisation sociale permettant de former ceux qui étaient chargés d'exploiter, d'amplifier et d'archiver les connaissances à venir. Les différents supports d'inscription des connaissances se sont succédés avec des capacités de conservation et de reproduction qui se sont sophistiqués avec le temps : tablettes pour l'écriture cunéiforme, parchemin, papyrus, papier. L'invention de l'imprimerie qui va donner un essor sans pareil à la diffusion des connaissances dans le monde. C'est depuis les années 80 que les environnements informatiques ont banalisé l'utilisation d'interfaces interactifs pour accéder à l'information archivée, organisée au sein des systèmes d'information. L'ère des bibliothèques numériques était arrivée. La banalisation des réseaux pour mettre en interconnexion les systèmes informatiques a entraîné des possibilités d'accès encore plus souple à ces inscriptions de connaissance avec un problème nouveau : la forme proposée pour l'accès aux connaissances inscrites n'a rien à voir avec la forme des inscriptions elles-mêmes. En effet, les informations sont codées au sein des bases de données sous une forme binaire, numérique par essence, tandis que les documents produits à l'écran ou sur des dispositifs d'impression sont élaborés de façon à être intelligibles pour une interprétation humaine. Toutefois, ces formes se multiplient avec les modalités techniques disponibles qui couvrent maintenant un large spectre (écrit, image, vidéo, son, 3D, etc.). Par ailleurs, les inscriptions étant codées numériquement, elles deviennent accessibles  à des calculs sur leurs contenus, autorisant une indexation automatique et par là même, permettant de mettre à disposition de beaucoup des inscriptions de connaissances sans passer par les étapes de classification et de reproduction physique (Internet et ses moteurs de recherche d'information). Internet et ses services constituent-t-ils pour autant un système de gestion de connnaissances ? Sans doute non, même s'il s'agit d'une incroyable source de connaissances, vivante et ubiquitaire.

Le premier article fondant la notion même de "Knowledge Management" est attribué à Karl Wiig: Wiig, K., Knowledge Management Foundations: Thinking about Thinking – How Organizations Create, Represent and Use Knowledge (Schema Press, 1993); Karl Wiig anime the "Knowledge Research Institute" où le lecteur pourra trouver un grand nombre de références sur le sujet et en particulier "100 histoires de gestion de connaissances". Voir http://www.krii.com/articles.htm.
Karl Wiig travaillait dans une équipe d'intelligence artificielle et ses travaux se poursuivent jusqu'à maintenant (bien que retraité depuis quelques années).

Les principes directeurs de la gestion de connaissance sont:
La gestion des connaissances ne doit pas se confondre avec l'intelligence économique qui consiste à observer les connaissances manipulées par les concurrents pour se faire une opinion sur leurs orientations et devancer les innovations possibles ou encore précéder les demandes du marché (quand il ne s'agit pas tout simplement de le contrôler). La veille scientifique et technique peut être liée à la gestion des connaissances, mais la plupart du temps consiste à vérifier que l'on est toujours en phase avec le niveau de connaissances publiées ou disponibles.
 

 Vérifions nos connaissances

 

4 - Information et connaissances: s'entraîner à faire la différence


Les températures affichées par votre thermomètre (température extérieure et température à l'intérieur de votre logement) sont des informations tant qu'elles ne permettent pas de décider d'une action ou d'une autre. Si vous dites simplement à la cantonade "il fait froid ce matin", vous donnez bien une information (que vous transmettez simplement) et il est bien possible que les autres haussent les épaules, si cette information ne fait pas sens. Par contre, si l'un des habitants du logement s'apprêtait à sortir en short, il y a des chances que "ça fasse sens" pour lui. S'il "sait" quoi faire de cette information, on pourra dire qu'il a la connaissance du comportement à adopter quand on doit sortir et qu'il fait froid...

"Il ne faut pas manger avec ses doigts à table" : ceci est bien une inscription de connaissance "sociale", valable dans nos contrées occidentales. Il faut noter, "qu'au pied de la lettre", on est bien obligé d'utiliser ses doigts pour tenir la fourchette ou le couteau. L'interprétation de cette inscription necessite pas mal de connaissances connexes préalables.

10 + 11 = 101 : c'est vrai en base 2, mais si on ne sait pas que l'on est en base 2, alors on se contentera de l'information portée par chacun des signes.

Si on a de la farine, des oeufs, du sucre, du beurre, de la levure, un moule à gateau, un four en état de marche alors il est possible de faire un quatre-quart. Il s'agit d'inscriptions de connaissances suffisantes pour un interprétant sachant déjà pas mal cuisiner. Il est toutefois possible de transmettre l'information à un cuisinier pour qu'il en fasse quelque chose.

Entraînez vous avec l'exercice suivant.

 Vérifions nos connaissances

© Alain Mille Août 2008