Documentation

Commandes vocales

Maintenez le bouton mic et parlez. Le parser résout produit + poids en une seule phrase, en français ou en anglais, sur l'appareil — votre audio ne quitte pas la tablette.

1. Activer le vocal sur la tablette

Le vocal est opt-in par appareil. Au premier appui sur le bouton mic, le navigateur demande la permission micro. Acceptez une fois et la tablette s'en souvient.

Vous pouvez aussi le basculer dans Paramètres → Vocal. Désactivé par défaut sur les tablettes partagées pour qu'aucune capture audio ne soit jamais une surprise.

Compatibilité navigateur : Chrome sur Android, Safari sur iPadOS 17+, Edge sur tablettes Windows. Snaptare utilise la Web Speech API native quand elle existe, avec un repli optionnel Whisper-tiny WASM si le navigateur n'a pas de reconnaissance native.

2. Utiliser le bouton mic

L'orbe mic se trouve à côté de la barre de recherche. Maintenez (ne tapez-relâchez pas) pendant que vous parlez. L'orbe respire en vert quand elle écoute ; elle revient au repos quand vous relâchez.

  • Le transcript en direct apparaît sous la barre de recherche pendant que vous parlez.
  • L'aperçu de correspondance montre le produit résolu dès que le parser est confiant (souvent avant la fin de la phrase).
  • Annuler : faites glisser le doigt hors de l'orbe. Rien n'est validé.
  • Valider : relâchez quand un produit est mis en avant. Il est ajouté au panier actif avec le poids dicté.

3. Phrases comprises par le parser

La grammaire est produit + quantité + unité, dans n'importe quel ordre. Le français et l'anglais parsent nativement, y compris les nombres en lettres.

Exemples français :

  • « Carottes deux cents grammes » → 200 g de carottes
  • « Un kilo et demi d'amandes » → 1500 g d'amandes
  • « Cumin, trente grammes » → 30 g de cumin
  • « Huile d'olive, un litre » → 1000 ml d'huile d'olive
  • « Trois savons » → 3 unités de savon (variante à l'unité)

Exemples anglais :

  • "Almonds, six hundred grams" → 600 g d'amandes
  • "Two kilos of rolled oats" → 2 kg de flocons d'avoine
  • "Carrot, two fifty" → 250 g de carottes (unité par défaut supposée)

Le parser est tolérant aux fautes — pluriels, accents, variantes orthographiques se résolvent vers le même produit canonique. « Carotte », « carottes », « carrotte » et « carrot » atteignent toutes carottes.

4. Où va l'audio

Sur Chrome et Safari, la Web Speech API résout sur l'appareil — Snaptare ne voit jamais la forme d'onde, uniquement le texte transcrit. On lance ensuite notre propre correspondance produit contre le catalogue local. Le micro n'est sollicité qu'au moment où vous appuyez sur l'orbe ; il ne tourne pas en continu.

Si vous activez le repli Whisper-tiny WASM (rare ; pour les navigateurs sans reconnaissance native), le modèle tourne entièrement sur l'appareil. Aucune donnée audio ne quitte la tablette dans aucun des deux cas.

5. Astuces pour boutiques bruyantes

  • Tablette à portée. Sur le comptoir, vous à 50 cm. Le micro intégré est omnidirectionnel, pas magique.
  • Parlez après que l'orbe brille. Les ~150 premières ms d'un appui démarrent la capture. « Carottes » prononcé instantanément peut couper le « C ».
  • Une phrase d'un trait. « Carottes, deux cents grammes » bat « Heu… carottes… euh… deux cents. » Le parser gère la langue naturelle, mais les pauses fragmentent les énoncés.
  • Fixez la langue. Paramètres → Langue sur Français sur les shifts FR — le biais phonétique du recognizer fait une vraie différence en milieu bruyant.
  • Repli sans vocal. Si la reconnaissance déraille trop dans votre boutique, désactivez le vocal et utilisez le clavier ou le scanner. La caisse marche très bien sans.