Hypertextes numérisés et histoire des idées

Georges Vignaux

Lab. Communication & Politique – CNRS-FRE 2813-

Equipe Hypertextes et textualité électronique)

gvignaux@mshparisnord.org

 

 

Les réflexions de notre équipe sont fortement orientées vers l’étude des formes internes de la textualité électronique et sur les opérations sémantiques et cognitives que celles-ci favorisent, cela dans le contexte concret de mise en place d’une plate-forme expérimentale d’offres de ressources, de développement ou d’adaptation d’outils et de services multimédias.

C’est dans ce contexte que s’inscrit notre programme  Hypertextes numérisés et histoire des idées : la naissance d’une science moderne du vivant, naturalistes et biologistes français au XIXe siècle. Ce programme scientifique est concrétisé par le projet CoLiSciences (Corpus de littérature scientifique) qui aboutit aujourd’hui à la mise en ligne d’un grand corpus balisé dans la perspective de consultations hypertextuelles multiples (http://www.colisciences.net).

 

 

La structure fondamentale de l’hypertextualité est une structure dynamique : le réseau des connaissances qui reflète l’interprétation des documents à un moment donné du processus de lecture, va orienter des parcours qui vont susciter de nouvelles interprétations, donner lieu à de nouvelles connaissances qui, à un moment ultérieur, pourront à leur tour jouer le rôle de guide de lecture et ainsi de suite...

Plusieurs opportunités stratégiques sont offertes au lecteur :

·         construire une lecture critique personnelle ;

·         contrôler ses propres lectures et parcours grâce au système des liens hypertextuels et à l’affichage du paratexte en mode multi-fenêtrage ;

·         élaborer une réflexion transversale issue de sa propre construction de connaissances, fondée sur les textes et leurs architectures de lecture.

 

 

Le Projet CoLiSciences (Corpus de littératures scientifiques)

 

 

Le noyau du projet consiste aujourd’hui en la mise en ligne d’un grand corpus balisé dans la perspective de consultations hypertextuelles multiples. Il s’agit d’un corpus des écrits des naturalistes et biologistes de langue française du XIXe siècle (environ 6 000 pages).

 

Les dimensions du projet

 

·         La dimension stratégique : il importe de construire un certain nombre de modèles de fonctionnalités transversales, permettant de tester les différentes formes d’indexation des données selon les contenus et les fonctionnalités requises (notices historiques et biographiques, bibliographies, sites complémentaires, classifications terminologiques, historiques, épistémologiques et sémantiques).

·         La dimension de l’offre : elle consiste dans cette mise à disposition d’un corpus de données originales, numérisées, balisées et indexées.

 

* Le terme base de connaissance est employé ici à la place de base de données. Les bases de données relationnelles sont le fondement de la quasi totalité des sites dynamiques commerciaux. Notre contexte est très différent, nos besoins et nos attentes sont donc eux aussi différents, aussi nous avons choisi de ne pas utiliser une base de données relationnelles, mais plutôt de conserver la base de connaissance au format XML.

 

Ce choix nous offre beaucoup plus de souplesse :

 

• Mise en ligne de nouveaux ouvrages sans phase de transformation préalable en vue de l’importation dans une base de données.

• Les documents sont conservés sous un format qui permet de les retravailler directement, en fait sous leur format de travail de base, on peut soit les afficher grâce à une feuille de style CSS, soit les traduire grâce à XSL.

• XML est implémenté dans PHP, d’où une manipulation simplifiée.

 

 

Les ambitions du site CoLiSciences : http://www.colisciences.net

 

Nos ambitions sont au nombre de quatre :

 

Culturelles et patrimoniales : Il s'agit, on l’a vu, de collecter, numériser et mettre à disposition un grand corpus des ouvrages et articles des principaux biologistes et naturalistes du 19e siècle, en langue française (près de 6 000 pages sont déjà offertes).

Intellectuelles et épistémiques : Le choix de ces textes permet de retracer une « histoire des idées », à savoir le développement durant cette période, d'une science moderne du vivant, articulée en plusieurs grands domaines : l'anatomie, l'anthropologie physique, la classification des espèces, les théories de l'évolution et de la sélection, la physiologie, l’éthologie, etc..

Scientifiques au sens de la modélisation sémantique : L'architecture du site traduit partiellement les réflexions de l'équipe centrées sur la problématique des hypertextes.

On peut définir l'hypertexte (cf. supra) comme un système interactif qui permet de construire et de gérer des liens sémantiques entre des objets repérables dans un ensemble de documents. Ici, par des liens hypertextuels, le lecteur peut, entre autres, à partir du texte, accéder  à : 1) un glossaire des termes scientifiques et techniques, 2) un répertoire des notions, 3) un dictionnaire des noms de personnes et des ouvrages cités dans chaque texte. Des parcours de lecture, surtout, lui sont proposés grâce à l'établissement de liens hypertextuels exprimant les relations sémantiques et conceptuelles que les notions entretiennent entre elles au travers des textes.

Cognitives et pédagogiques : Une de nos problématiques centrales est celle de la lecture et de la navigation dans une double perspective : 1) Les modalités de la lecture vont-elles radicalement changer avec le support électronique ? Quelles spécificités nouvelles seront-elles introduites dans l’acte de lire ? 2) Réciproquement, comment spécifier ces nouvelles conditions de l’offre de lecture pour l'apprentissage ? Comment maîtriser une hypertextualité largement déployée au travers des parcours offerts ? Comment ne pas se perdre dans une masse de données ? Comment se construit le sens dans un hypertexte (dans et à partir de) ?

 

CoLiSciences  : un outil pour l’étude des processus d’appropriation :

 

Considérant la complexité intrinsèque de ce qui est proposé, à la fois en termes de contenu et d’exploitation de celui-ci, ainsi que l’absence d’une tradition d’exercisation dans ce domaine, il paraît impossible de trouver des formes d’utilisation éducative suffisamment proches de ce qui peut être fait dans les formations institutionnelles. Cela conduit soit à imaginer des activités simples centrées sur des points précis soit des scénarios plus sophistiqués. L’idée centrale est donc celle de la création de parcours. On peut d’abord regarder du côté des experts, essentiellement des enseignants de SVT (sciences de la vie et de la Terre), des historiens des sciences et des philosophes. Ces experts sont conduits à bâtir des cours, notamment autour de notions ou de problèmes abordés ou traités dans le corpus indexé dans le cadre du programme CoLiSciences. Comparer les chemins construits, correspondant en gros à des visites guidées, et décrire comment sont utilisés les outils proposés (par exemple les relations entre les notions aidant à construire une généalogie de ces notions en termes d’histoire des idées, est un objectif essentiel. Les observations des experts peuvent fournir des indications sur les usages possibles par des plus novices et les chemins collectés enrichissent le corpus par l’adjonction de parcours sémantiques finalisés. Si l’on veut aller plus loin dans la structuration, on peut s’inspirer des travaux autour de l’argumentation, domaine qui a pris ces dernières années une place importante (Perelman, Grize, Vignaux). Fournir des structures argumentatives vides à remplir au cours d’une exploration, puis à réorganiser est une piste à creuser. On peut également penser aux systèmes de visualisation et de structuration tels Aquanet (Marshall & Rogers, 1992 ; Marshall et al., 1994).

Revisiter le concept d’hypertexte apparaît donc fondamental, y compris dans le contexte éducatif actuel (secondaire et supérieur) où la recherche d’informations, leur organisation et leur réorganisation, dans le cadre d’activités interdisciplinaires, occupent une place croissante.