logo hedron
conversazionale o non conversazionale
Riflessioni

Conversazionale o non conversazionale? Questo è il dilemma

La User Experience dei servizi attuali è ormai distribuita in sistemi digitali e IoT ubiqui, integrati in reti sempre più intelligenti e strettamente connesse, che pervadono fluidamente percorsi multicanale e multisensoriali.

I trend digitali attuali vedono nascere dai sistemi conversazionali nuove opportunità di ingaggio, e non solo nel mondo dell’assistenza e supporto ai clienti. Stiamo difatti scoprendo come l’interazione vocale possa collocarsi nella nostra vita quotidiana migliorandola e accorciando le distanze umano-macchina in alcuni momenti strategici del Customer Journey: prima, durante e dopo la fruizione di un servizio.

Gli attuali assistenti vocali come Google Assistant e Alexa sono sempre più allenati a rispondere agli utenti, gli smart speaker stanno acquisendo una fetta di mercato sempre più ampia – soprattutto negli USA, dove è previsto che il 75% delle famiglie ne avrà uno in casa entro il 2020 (Gartner, Edison Research 2017) – e la nuova Generazione Z (i nati dopo i Millennials) sembra essere meno timida e più propensa a interagire vocalmente con sistemi digitali.

Provando ad analizzare lo scenario attuale, d’altro canto, le interfacce vocali non sembrano ancora aver fatto profondamente presa sui Millennials, soprattutto al di fuori delle mura domestiche, dove gli scenari d’uso diventano più articolati e risentono fortemente delle influenze ambientali e relazionali.

Tutto spesso si riduce a un gioco sporadico, in cui gli utenti testano il sistema per scoprire cosa può fare, quanto è allenato a comprendere il linguaggio naturale, per poi abbandonare.
Molto dipende dalle aspettative generate rispetto alle reali capacità di questi strumenti vocali, quanto essi pretendono di sostituirsi alle interfacce grafiche, fin dove vogliono accompagnare gli utenti in un processo di acquisto, assistenza, prenotazione, informazione o altro.

Non soltanto una questione generazionale

Molti dicono che nel prossimo futuro la quasi totalità delle interazioni avverrà con sistemi vocali: non possiamo affermarlo con certezza, considerando soprattutto come negli ultimi decenni le macchine siano ciclicamente passate da interfacce esclusivamente grafiche ad audio o vocali, per poi tornare all’ibrido, come per esempio Amazon Echo Spot.

Il supporto di altre metodologie di interazione sarà comunque necessario finché i processi di comprensione del linguaggio naturale non saranno sufficientemente intelligenti. Al momento non possiamo pretendere un’effettiva modalità di interazione naturale, ma potrebbero prendere vita nuovi pattern di interazione più stilizzati che, seppur ispirandosi al mondo reale, si adattino ergonomicamente agli attuali strumenti digitali.

Ma le persone vogliono davvero conversare con le macchine? In un momento storico in cui rincorriamo spasmodicamente gli ultimi trend dell’innovazione digitale e in cui l’Intelligenza Artificiale che abbiamo romanzato per decenni non sembra più tanto irraggiungibile, dovremmo forse fermarci un attimo a riflettere. Non tutti stanno cercando di instaurare delle vere relazioni con macchine umanoidi, e l’obiettivo principale non è sostenere con loro delle reali conversazioni.

Cosa cercano gli utenti?

Quello che abbiamo imparato fino ad adesso è che le persone non hanno bisogno di mere macchine esecutrici, ma di facilitatori, di strumenti predittivi che, imparando dalle loro abitudini e preferenze, diventino companion capaci di migliorare la qualità della loro vita, soprattutto in scenari multicanale e multitasking.

Per il momento ciò avviene in conversazioni interrotte, che non seguono un vero e proprio flusso conversazionale, e che riguardano un ristretto numero di task; per esempio, tra i più frequenti con smart speaker e mobile: “Che tempo farà domani?”, “Imposta la sveglia alle 7:00”, “Chiama mamma”, “Portami alla stazione centrale”.

L’elaborazione del linguaggio naturale col tempo sarà raffinata, ma permarrà per molto l’impossibilità di poter gestire determinati casi d’uso al fine di garantire privacy e sicurezza. Immaginiamo di stare in metro mentre i nostri messaggi sono letti vocalmente; oppure immaginiamo di eseguire un bonifico a voce: un comando vocale può velocizzare l’avvio di una funzionalità, ma la percezione di sicurezza ad oggi è relegata alla conferma visiva del buon esito delle operazioni.

Conversazionale ed empatia

Da questo esempio emerge come, nell’adozione di un sistema conversazionale, l’importanza di empatizzare con i nostri utenti si faccia ancora più urgente, per supportarli soprattutto in scenari di tensione emotiva o interferenza ambientale: diverso è elencare gli ingredienti di una ricetta a chi sta cucinando in casa propria, rispetto a indicare un percorso a chi è in affanno in una stazione affollata.Indipendentemente dal tono di voce adottato (più o meno sintetico, amichevole, gentile), durante la progettazione di un flusso conversazionale è quindi fondamentale ottimizzare l’usabilità dell’interfaccia proponendo all’utente pattern propri del linguaggio naturale per:

  • garantire il controllo sul sistema, per esempio consentendogli di navigare e uscire da situazioni di errore con comandi familiari e variabili: “basta”, “stop”, “smetti”, ecc.;
  • garantire la visibilità sullo stato del sistema, fornendo per esempio la conferma della corretta o errata conclusione di un’operazione: “Domattina la sveglia suonerà alle 7:00, buonanotte!”;
  • non indurlo a imparare nuovi comandi, proponendo per esempio domande alle quali può rispondere con un semplice sì o un no: “Confermi l’invio del messaggio?” anziché “Per confermare puoi dire ‘confermo’”;
  • prevenire gli errori, elencando pochi risultati per volta: “Vuoi chiamare Sara B., Sara P., Sara M. o un’altra Sara?”.

È evidente che testare e progettare questi sistemi richiede competenze nuove e non ancora del tutto collaudate, unite a una più ampia collaborazione tra figure professionali multidisciplinari. Possiamo sicuramente dire, inoltre, che la corsa all’adozione delle tecnologie vocali senza obiettivi ben precisi, ma più per moda, ha sicuramente causato molta frustrazione negli utenti e un conseguente scetticismo verso questo tipo di interazioni.

Conversazionale o non conversazionale, quindi? Facile sarebbe lasciare “ai posteri l’ardua sentenza”. Ad oggi, conversazionale sì, ma solo quando è accompagnato da una fase di progettazione ben strutturata e quando effettivamente assiste l’utente, aumentando l’engagement e velocizzando la conversione.

Articolo pubblicato su cmimagazine.it.