Extracteur de données
La fonction Extraction de données permet aux utilisateurs de récupérer des informations structurées à partir de documents non structurés.
Ressources supplémentaires
Apprenez rapidement à extraire des informations complexes avec QAnswer Data Extractor. Regardez notre tutoriel d’1 minute pour une extraction précise et exportez vos données au format CSV !
To access this AI task click on Tâches IA and Extracteur de données :
La fonction Extraction de données permet de récupérer des informations structurées à partir de documents non structurés.
En entrant des entités, comme "Homer Simpson" avec le schéma de données que vous souhaitez extraire, par exemple "a des enfants", l’extracteur parcourt les documents pour trouver les réponses pertinentes, comme "Bart, Lisa et Maggie". De même, vous pouvez entrer "Chiffre d’affaires" avec "T1 2023" pour obtenir rapidement des données financières spécifiques.
Cette fonctionnalité simplifie la récupération de données et transforme efficacement le texte non structuré en informations exploitables.
Exemple
- Ouvrir les paramètres de la tâche
- Paramètres LLM
Lors de l’ajout de nouvelles entités, appuyez sur Entrée ou cliquez sur AJOUTER LES ENTITÉS pour chaque entité. De même, pour les schémas de données, appuyez sur Entrée ou cliquez sur AJOUTER pour chaque schéma.
Vous pouvez cliquer sur EFFACER pour supprimer tous les schémas que vous avez saisis, les entités seront conservées.
Après le processus d'extraction, vous pouvez cliquer sur EXPORTER CSV pour télécharger le résultat de l'extraction au format CSV.
L'icône bleue avec un numéro, par exemple, 1 , indique le lien sur lequel vous pouvez cliquer pour ouvrir la source contenant l’information extraite.
Paramètres de la tâche
Pour personnaliser votre assistant IA Extracteur de données, cliquez sur
. Vous pouvez configurer la manière dont votre assistant répond en :Ajustant les paramètres LLM : vous pouvez choisir le LLM qui alimentera les réponses, son niveau de créativité, la vitesse de réponse, la fenêtre de contexte en tokens, et la longueur maximale de réponse que vous souhaitez obtenir.
- Fenêtre de contexte (tokens) : quantité de texte (conversation + documents) que le modèle peut considérer en même temps. Si cette limite est dépassée, le contenu le plus ancien peut être ignoré.
- Longueur maximale de réponse : limite de tokens produits par le modèle pour éviter des réponses trop longues.
Astuce pratique : utilisez une température faible pour l’extraction factuelle, augmentez la fenêtre de contexte pour inclure de longs documents et fixez une longueur maximale pour contrôler la taille et le coût des réponses.
- Ouvrir les paramètres de la tâche
- Paramètres LLM