Le picking demeure le nerf de la guerre en entrepôt: exigeant, répétitif, variable. Agility Robotics affirme y engager son humanoïde Digit, avec des tests en environnement logistique réel. La promesse: des gains d’efficacité, en partie grâce à l’apprentissage par renforcement, mais sans métriques publiques à ce stade.
Au-delà de la démonstration, l’enjeu est clair: transformer un prototype photogénique en outil industriel capable d’exécuter des tâches utiles, de manière sûre, prévisible et économiquement défendable.
Le fait
Agility Robotics conduit des tests de son robot humanoïde Digit pour des tâches de picking en entrepôt. La couverture de ces essais indique un recours à l’apprentissage par renforcement pour entraîner et optimiser les comportements de manipulation, avec à la clé une efficacité accrue lors des expérimentations, selon les articles et communications consultés. Aucune donnée chiffrée (taux de réussite de prise, cadence, disponibilité) n’a toutefois été divulguée publiquement.
Deux sources publiques encadrent l’annonce:
- La reprise par la presse spécialisée: Robotics and Automation News.
- La communication d’Agility: page presse d’Agility Robotics.
Dans ces essais, Digit s’attaque à des scénarios typiques du picking: localiser des articles, appréhender des objets dans des bacs ou sur étagères, et les déposer à un point défini. Le tout dans des environnements proches d’opérations logistiques, c’est-à-dire soumis à de la variabilité (éclairage, encombrement, diversité des objets). L’apprentissage par renforcement est présenté comme un levier pour accélérer l’entraînement de politiques de saisie et d’interaction, potentiellement en simulation avant transfert sur le robot physique.
Pourquoi c’est important
Le marché logistique cherche des solutions capables d’absorber la variabilité du réel sans réingénierie lourde à chaque changement de référence. Les systèmes fixes (bras sur poste) excellent sur des tâches bien bornées, mais peinent dès que l’environnement change vite ou que la diversité d’objets explose. Les humanoïdes visent un créneau différent: mobilité et polyvalence à l’échelle humaine, en brownfield, sans refonte majeure des infrastructures.
Si Digit démontre une capacité fiable à enchaîner des prises dans des conditions réalistes, cela pourrait:
- Réduire les frictions d’intégration: passer là où un humain passerait, atteindre des emplacements standards, manipuler des objets courants.
- Lisser les pics d’activité: déploiements temporaires sur des postes goulots d’étranglement sans recâbler le site.
- Accélérer l’adaptation par l’entraînement en simulation et l’apprentissage par renforcement pour de nouvelles familles d’objets.
Le contexte concurrentiel s’échauffe: Figure, Apptronik, Sanctuary, Fourier, Unitree et d’autres multiplient les pilotes en logistique. Côté grands industriels, les démonstrations se succèdent. La différence se jouera désormais sur des KPI opérationnels audités et une économie unitaire soutenable par rapport aux alternatives (AMR + goods-to-person, postes de picking robotisés fixes, ou maintien d’effectifs humains).
Reality check / nuances
Plusieurs angles morts demeurent, et ils décideront de la viabilité de Digit en picking.
- Généralisation des politiques apprises: l’apprentissage par renforcement peut produire d’excellents résultats sur des distributions connues, mais la robustesse à la longue traîne des SKU (emballages souples, surfaces brillantes, objets déformables) reste à démontrer. Le sim-to-real est un défi persistant.
- Cadence et qualité: sans chiffres publics, impossible d’évaluer les picks per hour, le taux de réussite de prise et de dépose, ou l’impact des échecs (reprises, erreurs). C’est la métrique reine face aux solutions établies.
- Disponibilité et maintenance: l’endurance d’un humanoïde en poste de picking (heures d’autonomie, fréquence de swap batterie, downtime, MTBF) n’est pas documentée. La maintenance en environnement poussiéreux ou froid, et la tenue aux chocs, devront être prouvées.
- Sûreté fonctionnelle et coactivité: travailler à proximité d’humains implique un traitement rigoureux du risque (détection de présence, limitation d’efforts, arrêts sûrs). Le cadre normatif existant pour la robotique industrielle collaborative (par ex. ISO 10218/TS 15066) et la gestion des risques (ISO 12100) fournit des repères, mais il n’existe pas encore de standard dédié aux humanoïdes. La conformité locale et l’assurabilité seront scrutées.
- Intégration logicielle: sans intégration robuste au WMS/WES (allocation des tâches, inventaire, traçabilité), le robot reste une île. Les connecteurs, interfaces API et outils de supervision fleet-level feront la différence lors d’un passage à l’échelle.
- Économie unitaire: le TCO par ligne préparée, intégrant robot, intégration, MCO, assurance et réaménagement, doit battre ou égaler les alternatives. Sans données, il est trop tôt pour conclure.
En bref: la proposition de valeur est crédible sur le papier (mobilité + manipulation), et l’usage de l’apprentissage par renforcement comme accélérateur d’entraînement est cohérent avec l’état de l’art. Mais la maturité industrielle se joue dans les chiffres, l’assurabilité et la reproductibilité hors démonstration.
Ce qu’il faut surveiller
- Métriques publiées et auditées: taux de réussite de prise/dépose, picks per hour, temps de cycle, taux d’erreur, disponibilité, et comparatif A/B vs opérateurs humains ou solutions robotiques fixes, idéalement validés par un tiers.
- Robustesse multi-SKU: performance sur matériaux difficiles (plastiques brillants, sachets souples, articles déformables ou transparents), en éclairage variable et avec encombrement.
- Sécurité et conformité: publication d’analyses de risques, démarches de conformité et d’assurance, périmètres d’usage autorisés (coactivité ou zone dédiée), et scénarios de repli/arrêt sûr.
- Autonomie et MCO: endurance par charge, stratégie de swap/recharge, MTBF, modalités de maintenance préventive et curative, SLA de support.
- Intégration système: connecteurs WMS/WES, orchestration multi-robots, supervision à l’échelle (maps, trafic, priorité), et capacité à passer de 1, 2 unités à une flotte opérationnelle.
- Acceptation sociale et RH: cohabitation avec les équipes, ergonomie des postes, formation, et dialogue social, déterminants pour toute adoption durable.
- Modèle économique: options CapEx vs RaaS, tarification à la performance, et alignement incitatif avec les intégrateurs/3PL.
À ce stade, l’information publique est encourageante mais parcellaire. La balle est désormais dans le camp d’Agility: publier des KPI solides, étayer les gains attribués à l’apprentissage par renforcement, et démontrer que Digit tient la distance dans un entrepôt vivant. C’est à ces conditions que l’humanoïde passera du statut de démonstrateur à celui d’actif productif.
Sources: Robotics and Automation News, Agility Robotics, Press.









