🚀 Break Inertia. AI Your Business in 3 Days with our Free Bot! Book your 15min Demo Now!
Roi du Reranking RAG
Chez Pandorabot.io, nous comprenons les défis auxquels les organisations sont confrontées lorsqu'il s'agit d'accéder et d'utiliser efficacement les connaissances contenues dans leurs vastes collections de documents techniques. Nous nous spécialisons dans la fourniture de KnowledgeBots sur mesure, spécifiquement conçus pour résoudre le défi de la récupération des connaissances, même dans les situations les plus complexes.
4/21/20247 min read


Dans cet article, nous explorerons comment des techniques avancées telles que la génération augmentée par récupération (RAG), les embeddings, la recherche de similarité et le reranking peuvent révolutionner la récupération des connaissances dans les domaines techniques.
Génération Augmentée par Récupération (RAG)
La génération augmentée par récupération (RAG) est une approche puissante qui combine la récupération d'informations avec des modèles de génération de langage. Dans le contexte des documents techniques, la RAG permet aux systèmes de récupération des connaissances non seulement de trouver des passages pertinents, mais aussi de générer des réponses cohérentes et informatives basées sur les informations récupérées. En tirant parti des forces de la récupération et de la génération, la RAG permet une récupération des connaissances plus précise et plus contextuelle à partir de documents techniques.
Embeddings et Recherche de Similarité
Les embeddings sont des représentations vectorielles denses du texte qui capturent le sens sémantique et les relations entre les mots ou les passages. En convertissant les documents techniques et les schémas en embeddings, nous pouvons effectuer des recherches de similarité efficaces pour trouver des informations pertinentes en fonction de la similarité sémantique entre la requête et les documents intégrés. Cette approche va au-delà de la correspondance par mots-clés et permet de récupérer des documents qui sont conceptuellement liés à la requête, même s'ils ne contiennent pas exactement les mêmes termes.
La Puissance du Reranking
Bien que les embeddings et la recherche de similarité fournissent une base solide pour la récupération des connaissances, les techniques de reranking peuvent encore améliorer la précision et la pertinence des documents récupérés. Lors d'un projet récent avec une entreprise d'ingénierie, où plus de 2 000 documents techniques ont été ingérés et vectorisés, le besoin de reranking est devenu évident lors de la phase de test d'acceptation par les utilisateurs (UAT). Le directeur technique de l'entreprise a exprimé le souhait d'une récupération de documents encore plus précise. Pour répondre à cela, nous avons testé de manière approfondie les options de reranking suivantes en posant la même question :
Question technique : entrées et sorties pour le préchauffage Perkins 1306
Gemini 1.5
Gemini 1.5 est un modèle de reranking à la pointe de la technologie qui combine les forces de plusieurs modèles de langage. Il prend en compte divers facteurs tels que la pertinence, la cohérence et la diversité pour fournir un reranking équilibré des documents récupérés. Gemini 1.5 a montré des résultats prometteurs dans l'amélioration de la qualité de la récupération des connaissances dans les domaines techniques.
Voici un ordre possible de pertinence basé sur les documents fournis :
1. Document 0 (4008 TAG1A 644 - 882 kWm) : Ce document semble très pertinent car il traite spécifiquement du modèle de moteur Perkins 1306 et fournit des données techniques détaillées, y compris des sections sur "Installation générale" et "Système de refroidissement", qui sont directement liées au préchauffage.
2. Document 2 (Installation générale 4008TAG1A - Tempéré) : Ce document fournit des informations spécifiques sur l'installation générale du moteur 4008TAG1A, qui inclut probablement des détails pertinents sur les procédures de préchauffage.
3. Document 3 (4008TAG2A - Désignation tempérée) : Bien que centré sur le modèle 4008TAG2A, ce document pourrait offrir des informations sur les procédures de préchauffage applicables à la série Perkins 1306 en raison de similitudes potentielles entre les modèles.
4. Document 1 (Manuel du logiciel DSE P810 pour Windows ™) : Ce document, bien que lié au contrôleur DSE, pourrait contenir des informations sur les réglages et configurations de préchauffage qui pourraient être utiles.
5. Document 4 (4008TAG2A - Désignation tropicale) : Comme le document 3, ce document pourrait offrir des informations pertinentes en raison de caractéristiques partagées au sein de la série Perkins 1306.
6. Document 5 (Équilibre énergétique 4008TAG1A - Désignation tempérée) : Ce document se concentre probablement sur la consommation et la distribution d'énergie, ce qui peut ne pas être directement lié au préchauffage.
7. Document 6 (Données sur les niveaux de bruit) : Ce document semble concerner les niveaux de bruit et est peu susceptible de contenir des informations sur le préchauffage.
8. Document 7 (4008TAG1A et 4008TAG2A - Vue latérale gauche (tempérée)) : Ce document, bien qu'offrant une représentation visuelle du moteur, ne fournit probablement pas de détails spécifiques sur le préchauffage.
9. Document 8 (4008TAG1A et 4008TAG2A - Vue avant (tropicale)) : Comme le document 7, ce document peut ne pas traiter directement des procédures de préchauffage.
10. Document 9 (4008TAG1A et 4008TAG2A - Vue latérale droite (tropicale)) : Ce document, comme les documents 7 et 8, est peu susceptible d'être une source principale d'informations sur le préchauffage.
11. Document 10 (4008TAG1A et 4008TAG2A - Vue arrière (tropicale)) : Comme les documents 7, 8 et 9, ce document peut ne pas être directement pertinent pour le préchauffage.
12. Document 11 (Unité de contrôle CEA6) : Ce document, bien qu'il soit lié à un modèle de contrôleur différent, ne fournit probablement pas de détails spécifiques sur le préchauffage pour le Perkins 1306.
[0, 2, 3, 1]
Cohere Reranker
Le modèle de reranking multilingue v3.0 de Cohere utilise une compréhension avancée du langage naturel pour réorganiser les documents récupérés en fonction de leur pertinence par rapport à la requête. En prenant en compte le contexte sémantique et les relations entre la requête et les documents, Cohere Reranker peut améliorer considérablement la précision des résultats récupérés.
Cohere reranking
RerankResponseResultsItem(document=None, index=3, relevance_score=0.6087685),
RerankResponseResultsItem(document=None, index=2, relevance_score=0.2961451),
RerankResponseResultsItem(document=None, index=1, relevance_score=0.2791402),
RerankResponseResultsItem(document=None, index=6, relevance_score=0.07450026),
RerankResponseResultsItem(document=None, index=5, relevance_score=0.02092419),
RerankResponseResultsItem(document=None, index=0, relevance_score=0.016090874),
RerankResponseResultsItem(document=None, index=4, relevance_score=0.009196552)], meta=ApiMeta(api_version=ApiMetaApiVersion(version='1', is_deprecated=None, is_experimental=None), billed_units=ApiMetaBilledUnits(input_tokens=None, output_tokens=None, search_units=1, classifications=None), tokens=None, warnings=None))
Claude Opus
Claude Opus est un modèle de reranking spécifiquement conçu pour les documents techniques. Il intègre des connaissances spécifiques au domaine et comprend les subtilités du langage et des concepts techniques. En tirant parti de sa compréhension du jargon technique et du contexte, Claude Opus peut reranker efficacement les documents récupérés pour prioriser les résultats les plus pertinents et informatifs.
Claude Opus 3
Sur la base de la question utilisateur fournie et de la liste des documents,
voici mon classement des documents du plus pertinent au moins pertinent pour répondre à la question "entrées et sorties pour le préchauffage Perkins 1306" :
1. Le document le plus pertinent semble être le document 1, car il mentionne spécifiquement le moteur Perkins 1306 et décrit les entrées et sorties liées au système de préchauffage, y compris l'entrée de l'interrupteur de préchauffage et la sortie du relais de préchauffage.
2. Le document 0 serait le suivant en pertinence, car il discute du système de préchauffage en termes généraux pour les moteurs Perkins, bien qu'il ne mentionne pas spécifiquement le modèle 1306.
3. Le document 2 mentionne les moteurs Perkins mais ne contient aucune information sur le préchauffage ou les entrées/sorties, il est donc moins pertinent que les documents 1 et 0.
4. Le document 3 n'est pas du tout pertinent, car il concerne un autre fabricant de moteurs (Cummins) et ne mentionne pas le préchauffage.
Donc en résumé, mon classement du plus pertinent au moins pertinent pour répondre à la question "entrées et sorties pour le préchauffage Perkins 1306" est :
[1, 0, 2, 3]
La combinaison de la RAG, des embeddings, de la recherche de similarité et des techniques de reranking a le potentiel de révolutionner la récupération des connaissances dans les domaines techniques. En tirant parti de ces approches avancées, les organisations peuvent exploiter tout le potentiel de leurs documents et schémas techniques, permettant un accès plus rapide à des informations pertinentes et facilitant une meilleure prise de décision. À mesure que nous continuons à affiner et à optimiser ces techniques, nous pouvons nous attendre à des systèmes de récupération des connaissances encore plus précis et efficaces, permettant aux entreprises d'ingénierie et autres organisations techniques de rester en tête dans un paysage concurrentiel.
Claude Haiku
RAG tire des connaissances profondes, Opus est épuré, rapide — mais attendons la profondeur de Haiku pour un faible coût / grande vitesse :
Sur la base de la question utilisateur donnée "entrées et sorties pour le préchauffage Perkins 1306"
et de la liste des documents, je classerais la pertinence des documents comme suit :
La justification est :
Ce document est probablement le plus pertinent car il mentionne spécifiquement "Perkins 1306" et discute des informations sur les entrées et sorties, ce qui est directement lié à la question de l'utilisateur.
Ce document mentionne également "Perkins 1306" et discute des spécifications du moteur, ce qui pourrait être pertinent pour répondre à la question.
Bien que ce document discute des moteurs Perkins, il ne mentionne pas spécifiquement le modèle 1306, il est donc moins directement pertinent que les deux premiers documents.
Ce document discute de l'entretien des moteurs Perkins, mais ne semble pas contenir d'informations spécifiques sur les entrées et sorties du modèle 1306.
Ce document discute du dépannage des moteurs Perkins, mais encore une fois, ne semble pas contenir d'informations directes sur le modèle 1306.
Ce document discute des pièces des moteurs Perkins, mais ne semble pas contenir d'informations directement pertinentes à la question de l'utilisateur.
[0, 2, 1, 3, 4, 5]
Le rôle de Pandorabot.io dans l'amélioration des expériences de chatbot
🧠 KnowledgeBot 💰SalesBot 🛠️ ServiceBot 👁️🗨️VisionBot
Pour les entreprises cherchant à exploiter tout le potentiel de l'IA dans les interactions avec les clients, Pandorabot.io se positionne comme une solution de premier plan. Spécialisée dans la création de chatbots sur mesure, Pandorabot.io offre une plateforme où les entreprises peuvent développer des chatbots non seulement alignés sur leurs besoins spécifiques, mais aussi capables d'évoluer avec eux. Nos chatbots sont conçus pour offrir des interactions nuancées, spécifiques à l'industrie, une intégration transparente avec les systèmes commerciaux, et des mesures de sécurité des données à la pointe de la technologie. Avec Pandorabot.io, les entreprises peuvent garantir une expérience chatbot qui améliore l'engagement client, renforce la réputation de la marque et optimise l'efficacité opérationnelle.


