Présentation générale de TAMIS

TAMIS est une plateforme Web de gestion des métadonnées associées aux livres québécois. Elle est le fruit d’une collaboration entre Gilles Herman, directeur des éditions du Septentrion, puis Christian Roy et Clément Laberge de la firme A10s. Le projet a pour but de favoriser la découvrabilité de la littérature québécoise en développant des outils pour générer et gérer des métadonnées sur les livres à l’aide de l’intelligence artificielle. Le service est particulièrement utile pour les libraires qui peuvent effectuer des recherches précises à propos d’un livre pour leur clientèle. Il l’est aussi pour les maisons d’éditions et distributeur.ices qui peuvent intégrer leur catalogue à la base de données TAMIS et ainsi créer des métadonnées à propos de leurs ouvrages.

Quelques fonctions de l’outil

En plus de cataloguer des informations paratextuelles telles que le titre de l’œuvre ou le nom de son auteur.ice, la console TAMIS crée et compile des entités liées aux textes eux-mêmes. Ces dernières sont des références textuelles explicites à des gens, des lieux, des objets, des concepts, etc. Les créateurs de TAMIS donnent l’exemple suivant : dans la phrase « Voir Montmartre peut être considéré comme de la chance. Pas pour moi, car je suis né à Paris », tirée de Confidences à l’aveugle d’Alain Raimbault, les termes « Montmartre », « chance » et « Paris » sont des entités. Ainsi, les fichiers PDF, ePub et TXT des œuvres sont intégrés à la base de données et peuvent être analysés par l’intelligence artificielle qui en dégage les termes récurrents pouvant servir d’entités.

L'image présente la console TAMIS et utilise l'exemple du livre « La Constellation du Lynx ». Le titre de l'œuvre et le nom de l'éditeur, soit Éditions du Boréal, sont tout en haut de la page. La couverture du livre se trouve à droite du titre et de l'édition. La quatrième de couverture est écrite sous le titre. Sous la quatrième de couverture se trouvent les identifiants BISAC et les mots clés associés à l'œuvre. Sous ces termes identifiés par des rectangles bleu foncé se trouvent deux grandes fenêtres contenant les entités de lieu que l'on retrouve dans le texte. La fenêtre de gauche est en français et celle de droite en anglais. Chaque fenêtre contient une longue liste de termes.
La liste d’entités de lieux associées à l’œuvre « La Constellation du Lynx » publié aux Éditions Boréal. Crédit : Projet TAMIS.

Les entités sont compilées dans la fiche liée à l’œuvre par l’intelligence artificielle, ce qui permet à la plateforme et aux moteurs de recherche de faire des liens entre les œuvres, mais aussi entre ces dernières et l’ensemble du Web, puisque chaque entité est associée à une entrée Wikidata et Wikipédia. Les fiches de livres contenant ces entités sont donc elles aussi associées aux entrées qui leur correspondent. Ce processus permet aux livres d’être connectés à une constellation de termes, de concepts, de gens, d’objets et de lieux, les faisant ressortir lorsqu’un.e usager.ère fait une recherche sur le Web. Ainsi, les ouvrages québécois intégrés à TAMIS ont une meilleure visibilité sur Internet grâce à la grande quantité de métadonnées créées, qui forment un réseau de liens entre les œuvres et les entités qui leur sont rattachées.

Cette fonction particulière n’est toutefois pas la seule qui intéresse l’équipe derrière la plateforme. Le programme est capable d’analyser les pages couvertures, puis d’en faire ressortir les couleurs principales en plus de proposer des termes en lien avec ce qu’on y voit. Par exemple, une figure humaine qui se tient debout devant l’océan pourrait avoir comme libellés les mots « bleu », « peuple », « peau » et « biologie ». Certaines entités semblent être de meilleurs descripteurs que d’autres, ce que l’intelligence artificielle peut reconnaître puisqu’elle attribue des indicateurs de confiance à chacun des termes. Les libellés sont accompagnés d’un nombre entre 1 et 100 qui fait état de la pertinence de la suggestion, le 100 représentant une pertinence élevée et le 1, une pertinence basse.

L'image montre la page de la console TAMIS pour l'œuvre « Bébé Boum ». Au haut de la page se trouve la page couverture du roman avec, à sa droite, le texte de la quatrième de couverture et les sujets BISAC pertinents. Sous ces éléments se trouve une liste d'identifiants BISAC choisis par l'intelligence artificielle. Les suggestions sont organisées en colonne, la première étant la plus appropriée et la dernière étant la moins appropriée. Dans une rangée se trouve le code BISAC à gauche, le nom associé à ce code au milieu, puis l'indicateur de confiance écrit en chiffres tout à fait à gauche.
Les indicateurs de confiance pour les identifiants BISAC que l’intelligence articielle propose pour l’oeuvre « Bébé Boum ». Crédit : Projet TAMIS.

Comment utiliser la console TAMIS ?

Si un.e client.e entre dans une librairie et cherche un livre qui a une couverture rouge et qui aborde un sujet en particulier, les libraires peuvent interroger la base de données avec le terme « rouge » et le sujet afin de retrouver l’ouvrage en question. Cette fonctionnalité intéresse aussi les maisons d’édition, les auteur.ices et les distributeur.ices, puisque les librairies sont plus à même de recommander leurs livres à la clientèle en effectuant une recherche dans la base de données.

Pour que ces résultats sortent, toutefois, il faut intégrer les ouvrages à la console TAMIS. On peut le faire manuellement ou automatiquement à partir d’un entrepôt de livres numériques. Les fichiers textuels et visuels sont ensuite analysés par l’intelligence artificielle qui propose des descripteurs accompagnés d’un indicateur de confiance. Les utilisateur.ices de TAMIS peuvent sélectionner les termes qui leur paraissent les plus pertinents et ainsi personnaliser les fiches qu’ils et elles ont intégrées à la plateforme. Les descriptions qui sont produites de cette façon sont tirées du vocabulaire contrôlé de schema.org et générées au format JSON-LD, qui est un standard technique pour décrire les livres. Par la suite, le code JSON-LD peut être inséré à un site web qui décrit l’ouvrage, ce qui favorise l’assimilation des métadonnées par les moteurs de recherche.

L’intelligence artificielle propose aussi une classification BISAC pour chacune des œuvres. Ce système permet de catégoriser les livres selon un vocabulaire fixe et accepté par une majeure partie des institutions littéraires à l’international. Comme pour les descripteurs, les utilisateur.ices de la plateforme peuvent choisir la classification BISAC proposée par l’IA qui représente le mieux les livres. Ces derniers s’inscrivent donc dans un réseau mondial de publications littéraires, favorisant leur découverte et leur circulation aux quatre coins du globe, comme le souhaitaient les fondateurs du projet.

Pour en savoir plus

0 Shares:
Vous aimerez aussi...