\n\n\n\n Milvus en 2026 : 5 choses après 3 mois d'utilisation - AgntZen \n

Milvus en 2026 : 5 choses après 3 mois d’utilisation

📖 7 min read1,305 wordsUpdated Mar 27, 2026

Après 3 mois avec Milvus en production : c’est convenable pour le prototypage, frustrant pour l’échelle.

Alors voilà, cela fait trois mois que je travaille avec Milvus pour un projet axé sur la recherche de similarité vectorielle. Pour vous donner un peu de contexte, j’ai commencé à utiliser Milvus en janvier 2026 et je l’ai intégré dans une application de taille moyenne impliquant un système de recommandation. L’échelle était relativement significative, atteignant environ 2 millions d’entrées dans notre espace vectoriel durant les périodes d’utilisation maximale. Mon enthousiasme initial pour le projet a maintenant cédé la place à un enthousiasme modéré.

À quoi je l’ai utilisé

Comme je l’ai mentionné plus tôt, je travaille sur un moteur de recommandation qui prédit les préférences des utilisateurs en fonction de leur comportement historique. Ce système prend les interactions des utilisateurs et les transforme en embeddings vectoriels. Nous avons opté pour Milvus car nous avions besoin d’un moteur de stockage spécialisé dans les requêtes de données de haute dimension.

En trois mois, j’ai poussé Milvus à ses limites. La charge de travail comprend non seulement des requêtes, mais aussi la mise à jour continue des données au fur et à mesure que les nouveaux retours des utilisateurs arrivent. Notre architecture utilise un modèle de microservices, ce qui signifie que Milvus est une pièce d’un puzzle plus grand, s’intégrant avec un backend Node.js et un frontend React.

Ce qui fonctionne

Tout d’abord, la capacité à gérer les recherches vectorielles est ce qui permet à Milvus de vraiment briller. Les capacités d’indexation, notamment avec le type d’index IVF (Inverted File), ont été excellentes pour accélérer les requêtes. Une fois, j’ai effectué un test simple avec une recherche de similarité cosinus sur 100 000 vecteurs, et il a retourné des résultats en moins de 100 millisecondes avec une précision moyenne de plus de 95 %. Voici ce qui a également bien fonctionné pour moi :

1. Plusieurs Types d’Index

Milvus offre un ensemble diversifié de méthodes d’indexation, telles que HNSW (Hierarchical Navigable Small World) et IVF, qui donnent aux développeurs de la flexibilité en fonction de leurs charges de travail. En fonction du compromis entre la vitesse de recherche et la précision, j’ai pu changer de type d’index sans problème.

2. Fonctionnalités de Scalabilité

Lorsqu’il est exécuté sur un cluster Kubernetes, l’auto-scaling de Milvus a très bien fonctionné sous charge. J’ai effectué des benchmarks avec 100 utilisateurs concurrentiels, et mon service Milvus conteneurisé a amélioré ses performances lors de demandes de pic. Nous avons rarement constaté une dégradation des performances, ce qui a été une agréable surprise. Cependant, l’échelle n’était pas sans ses problèmes, comme le décrit la section suivante.

3. Communauté et Support

La communauté Milvus est active ; j’ai posé des questions sur leur page d’issues GitHub et j’ai reçu des retours en moins de 24 heures. Le développement actif est un atout, le dépôt Milvus affichant 43 421 étoiles et 3 909 forks. Voir ce niveau d’engagement vous donne confiance en relation aux futures mises à jour et au support, surtout avec des problèmes réels abordés dans les problèmes ouverts.

Fonctionnalité Types d’Indexation Scalabilité Engagement Communautaire (Étoiles/Forks)
Milvus IVF, HNSW, ANNOY Excellent 43 421 / 3 909
Faiss IVF, HNSW Bon 22 718 / 4 226
Pinecone Standard Modéré 8 123 / 1 025

Ce qui ne fonctionne pas

Mais bon, tout n’est pas rose. Ce qui ne fonctionne pas avec Milvus peut parfois être douloureusement évident. Voici un résumé franc :

1. Gestion des Erreurs

Oh là là, les messages d’erreur peuvent être cryptiques. Une fois, lors de la réindexation de vecteurs, j’ai reçu l’erreur suivante :


2026-03-15 14:23:45 - ERROR - [code: 4004] - Index Error - Invalid indexing type specified.

Le message ne spécifiait pas quel type d’index était invalide. J’ai fini par passer une bonne heure à essayer de résoudre quelle partie de ma requête était incorrecte. Avoir des messages d’erreur plus clairs permettrait d’économiser d’innombrables heures de débogage.

2. Consommation de Ressources

Sur des machines bas de gamme, Milvus peut consommer énormément de ressources. Mon déploiement initial sur une instance AWS EC2 basique avec 16 Go de RAM et un seul CPU a eu du mal à maintenir des performances acceptables. Des requêtes non optimisées entraînaient une utilisation mémoire significative, provoquant des crashs lors d’opérations simples. Les ressources nécessaires pour le faire fonctionner efficacement peuvent être dissuasives, surtout pour les petites équipes.

3. Lacunes Documentaires

Écoutez, je comprends que chaque projet open-source a ses défauts, mais la documentation de Milvus peut manquer de clarté dans certains domaines. Je me suis retrouvé à explorer les problèmes GitHub ou des forums externes car certaines configurations avancées n’étaient pas suffisamment couvertes dans leur documentation utilisateur. Ce syndrome de « fonctionnalité non documentée » était frustrant quand on veut itérer rapidement.

Tableau Comparatif

Maintenant, étant donné l’état de Milvus, vous vous demandez peut-être comment il se compare à ses concurrents. Voici un tableau comparatif entre Milvus et deux alternatives : Faiss et Pinecone.

Critères Milvus Faiss Pinecone
Facilité d’utilisation Modérée Élevée Élevée
Vitesse de Requête Rapide Très Rapide Rapide
Coût Gratuit (open-source) Gratuit (open-source) Basé sur abonnement
Scalabilité Excellent Bon Excellent
Support Communautaire Actif Actif Modéré

Les Chiffres

Alors, à quoi ressemblent les métriques de performance ? Après avoir effectué de nombreux tests sur les temps de requêtes et l’utilisation des ressources, voici ce que j’ai trouvé :

  • Indexation de 1 million de vecteurs : A pris en moyenne 32 secondes en utilisant HNSW.
  • Temps de Recherche : Moyenne de 75 ms pour 10 000 vecteurs.
  • Utilisation Mémoire : Atteint environ 7 Go lors d’une recherche de 2 millions de vecteurs.

Comparativement, mes tests avec Faiss dans des conditions similaires ont donné des résultats légèrement meilleurs :

  • Indexation de 1 million de vecteurs : 28 secondes avec HNSW.
  • Temps de Recherche : 60 ms pour 10 000 vecteurs.

Qui devrait l’utiliser

Si vous êtes un data scientist ou un développeur backend cherchant à déployer un moteur de recommandation, Milvus pourrait bien fonctionner pour vous, surtout si vous êtes dans une phase de prototypage. Il est définitivement adapté aux applications de taille moyenne, où votre équipe est prête à jongler avec les particularités de l’environnement pour que les choses avancent rapidement. Si vous expérimentez avec des applications d’apprentissage profond et que vous voulez juste des capacités de recherche vectorielle, allez-y !

Qui ne devrait pas

Si vous êtes un développeur solo sur un petit projet et que vous ne souhaitez qu’un outil qui fonctionne immédiatement, passez votre chemin. La configuration peut devenir un peu compliquée lorsque vous débutez, sans parler des problèmes de mémoire. Je ne le recommanderais pas pour des applications de grande taille avec des exigences en temps réel tant qu’ils n’améliorent pas la gestion des erreurs et l’optimisation des ressources. Les entreprises à la recherche d’un outil de production professionnel et poli devraient également réfléchir à deux fois.

FAQs

Milvus est-il gratuit à utiliser ?

Oui, Milvus est open-source et sous licence Apache 2.0, vous pouvez donc le modifier, le distribuer et l’utiliser gratuitement.

Puis-je utiliser Milvus avec des fournisseurs de cloud ?

Absolument ! Vous pouvez exécuter Milvus sur AWS, Google Cloud ou tout fournisseur de cloud qui prend en charge l’orchestration de conteneurs.

Quels langages de programmation sont pris en charge par Milvus ?

Milvus dispose de SDK pour Python, Go et Java, entre autres. Si vous êtes dans un environnement polyglotte, vous ne devriez avoir aucun problème à l’intégrer.

Données à jour au 21 mars 2026. Sources : Dépôt GitHub de Milvus, Documentation de Milvus

Articles Connus

🕒 Published:

✍️
Written by Jake Chen

AI technology writer and researcher.

Learn more →
Browse Topics: Best Practices | Case Studies | General | minimalism | philosophy
Scroll to Top