Document - Source de données

Utilisez un ou plusieurs documents comme source de données. Cette section explique comment téléverser des documents.

Cliquez sur Document pour ajouter des documents comme source de données :

Add data source menu

Téléverser

Téléversez vos fichiers (cliquez ou faites glisser-déposer dans la zone dédiée) :

Info
Les formats de fichiers actuellement pris en charge sont : .txt, .html, .md, .ods, .docx, .xlsx, .doc, .rtf, .odt, .csv, .pdf, .pptx
document empty

Reconnaissance optique de caractères (OCR)

Pour activer la fonctionnalité OCR, cliquez sur le bouton interrupteur situé à droite du document sur lequel vous souhaitez appliquer l'OCR.

L'OCR convertit une image de texte en texte lisible par machine. Par exemple, la numérisation d'un document produit un fichier image qui ne peut pas être modifié, recherché ou compté directement.

L'OCR convertit cette image en un document texte dont le contenu est stocké sous forme de données textuelles.

documents list OCR

Une fois tous les documents spécifiés, cliquez sur « Terminer ». La page de source de données s'ouvre :

documents list
Conseil

Pour tester cette source de données, utilisez cette collection de PDF sur les Simpsons :

Ces documents proviennent de le wiki des Simpsons

Accédez à une interface de recherche en direct basée sur cette collection de PDF :