DeepEval
Framework open-source pour évaluer, tester et fiabiliser des applications LLM, agents et pipelines RAG.
Framework open-source permettant de tester, comparer et évaluer prompts, modèles et pipelines LLM.
Promptfoo est un outil très pragmatique qui apporte des pratiques de test logiciel classiques au monde des LLM. Sa force est la reproductibilité et la simplicité d’intégration. Il est particulièrement adapté aux équipes techniques cherchant à éviter des régressions coûteuses. En revanche, il nécessite un investissement initial pour définir de bons cas de test et des critères de qualité pertinents.
Framework open-source pour évaluer, tester et fiabiliser des applications LLM, agents et pipelines RAG.
Créateur de pipelines IA & LLM via interface drag-and-drop.
Plateforme de monitoring, d’évaluation et d’amélioration continue de la qualité des applications basées sur des LLM.
NeuraForge AI est une plateforme d’automatisation intelligente conçue pour créer des workflows IA avancés, coordonner des agents autonome…
Fonctionnalités de recherche vectorielle et sémantique intégrées à Elasticsearch pour des architectures RAG enterprise.
Plateforme open-source de tests, d’évaluation et de sécurisation des modèles IA et applications LLM.
Ce hub relie Promptfoo aux alternatives, comparatifs, catégories et intentions proches afin d’aider les utilisateurs et les moteurs IA à comprendre son contexte, ses concurrents et ses cas d’usage.