Document - Source de données
Utilisez un ou plusieurs documents comme source de données. Cette section explique comment téléverser des documents.
Cliquez sur Document pour ajouter des documents comme source de données :
Téléverser
Téléversez vos fichiers (cliquez ou faites glisser-déposer dans la zone dédiée) :
Reconnaissance optique de caractères (OCR)
Pour activer la fonctionnalité OCR, cliquez sur le bouton interrupteur situé à droite du document sur lequel vous souhaitez appliquer l'OCR.
L'OCR convertit une image de texte en texte lisible par machine. Par exemple, la numérisation d'un document produit un fichier image qui ne peut pas être modifié, recherché ou compté directement.
L'OCR convertit cette image en un document texte dont le contenu est stocké sous forme de données textuelles.
Une fois tous les documents spécifiés, cliquez sur « Terminer ». La page de source de données s'ouvre :
Actions groupées sur les fichiers sélectionnés
Vous pouvez sélectionner plusieurs fichiers à la fois en utilisant les cases à cocher sur le côté gauche de chaque ligne.
Une fois un ou plusieurs fichiers sélectionnés, une barre d'actions groupées apparaît au-dessus du tableau avec les actions suivantes :
- Télécharger — télécharge tous les fichiers PDF sélectionnés en une seule fois. Le bouton est actif uniquement lorsqu'au moins un fichier sélectionné est un PDF ou un fichier audio avec le statut Indexé.
- Supprimer — supprime définitivement tous les fichiers sélectionnés du connecteur.
Pour tester cette source de données, utilisez cette collection de PDF sur les Simpsons :
Ces documents proviennent de le wiki des Simpsons
Accédez à une interface de recherche en direct basée sur cette collection de PDF :





