Document - Source de données

Utilisez un ou plusieurs documents comme source de données. Cette section explique comment téléverser des documents.

Cliquez sur Document pour ajouter des documents comme source de données :

Add data source menu

Téléverser

Téléversez vos fichiers (cliquez ou faites glisser-déposer dans la zone dédiée) :

Info
Les formats de fichiers actuellement pris en charge sont : .txt, .html, .md, .ods, .docx, .xlsx, .doc, .rtf, .odt, .csv, .pdf, .pptx
document empty

Reconnaissance optique de caractères (OCR)

Pour activer la fonctionnalité OCR, cliquez sur le bouton interrupteur situé à droite du document sur lequel vous souhaitez appliquer l'OCR.

L'OCR convertit une image de texte en texte lisible par machine. Par exemple, la numérisation d'un document produit un fichier image qui ne peut pas être modifié, recherché ou compté directement.

L'OCR convertit cette image en un document texte dont le contenu est stocké sous forme de données textuelles.

documents list OCR

Une fois tous les documents spécifiés, cliquez sur « Terminer ». La page de source de données s'ouvre :

documents list

Actions groupées sur les fichiers sélectionnés

Vous pouvez sélectionner plusieurs fichiers à la fois en utilisant les cases à cocher sur le côté gauche de chaque ligne.

Une fois un ou plusieurs fichiers sélectionnés, une barre d'actions groupées apparaît au-dessus du tableau avec les actions suivantes :

  • Téléchargertélécharge tous les fichiers PDF sélectionnés en une seule fois. Le bouton est actif uniquement lorsqu'au moins un fichier sélectionné est un PDF ou un fichier audio avec le statut Indexé.
  • Supprimersupprime définitivement tous les fichiers sélectionnés du connecteur.
Document table with batch download and delete toolbar
Conseil

Pour tester cette source de données, utilisez cette collection de PDF sur les Simpsons :

Ces documents proviennent de le wiki des Simpsons

Accédez à une interface de recherche en direct basée sur cette collection de PDF :