MacSpeech Dictate: il riconoscimento vocale su Mac

Come previsto nel post precedente per ovviare ai problemi Cirrus su BootCamp siamo stati costretti a spostare l’attività di dettatura al pc direttamente su Leopard.
Circa 200 Euro il costo del MacSpeech Dictate, analogo del Dragon Naturally Speaking, ma tutti veramente ben spesi.

Il MacSpeech (che ricordiamo è stato proprio recentemente acquisito dalla Nuance, casa software proprietaria del Dragon) si è rivelato nettamente superiore del rivale funzionante su Windows per velocità di installazione, capacità di apprendimento vocale e resa del testo sotto dettatura.

L’installazione richiede appena 5 minuti. In poche righe di testo il MacSpeech acquisisce subito la capacità di riconoscere la nostra voce.

Le fuzioni, grafica a parte, sono intuitive e immediatamente riconoscibili. Tramite un comodo editor di vocabolario è possibile inserire nuove parole o importarle in un’unica soluzione dai nostri files già presenti nel pc.
In caso di difficoltà di riconoscimento di una singola parola (evento peraltro raro), è possibile ricercare il vocabolo nell’editor e ripetere l’addestramento vocale per il singolo lemma.

La velocità di riconoscimento vocale è superiore alla media e superiore alle prestazioni del Dragon. Le parole compaiono sullo schermo quasi contemporeanamente alla voce anche parlando in modo molto naturale, senza letteralmente “dettare”.

Inutile dilungarsi oltre: un software eccellente.

Se hai bisogno di assistenza per installare il software di cui parlo in questo articolo clicca qui

Thomas Pistoia

Dragon Naturally Speaking, Cirrus Logic, Mac e BootCamp

Ho affrontato in un un paio di post precedenti l’uso di Dragon Naturally Speaking in relazione alla possibilità di far trascrivere a un pc la voce umana (dalla dettatura di interi documenti, alla possibilità di mero comando vocale).
L’esperienza mi porta attraverso le richieste dei clienti a scoprire nuovi aspetti dell’argomento.
Il mio cliente che abitualmente utilizza il Dragon ha deciso di passare al Mac.
Benchè la Nuance, casa produttrice del Dragon Naturally Speaking, abbia recentemente acquistato anche un software di dettatura vocale che funziona su sistemi Apple, il MacSpeech, si è deciso di utilizzare BootCamp e di far girare Xp e il Dragon sull’ iMac del cliente.
Col BootCamp Windows ha subito preso a funzionare perfettamente. I problemi sono cominciati subito dopo l’installazione del Dragon, al momento di procedere al necessario addestramento vocale.
Il controllo di qualità audio viene superato con valori che variano dal 18 al 22%, ma la fase di riconoscimento vocale (quella che comincia con la frase “Benvenuti nel mondo del riconoscimento vocale continuo”) non riesce a partire. Il programma sente la voce (la barra verde si muove) ma resta bloccato su questa prima frase e non prosegue l’addestramento.
Ho cominciato dunque le indagini.
Sulle prime ho pensato a un difetto del programma, ma sia le ricerche su internet, sia un rapido messaggio all’assistenza Nuance hanno escluso questa eventualità. In particolare l’assistenza mi ha consigliato di verificare problemi hardware.
Al problema hardware ho unito l’unica vera differenza tra questa installazione del Dragon Naturally Speaking e le altre fatte in passato. Le precedenti sono avvenute su pc con sistema operativo Windows; questa su Mac con BootCamp.
Ecco cosa scopro: la scheda audio in dotazione al Mac è identificata come Cirrus Logic High Definition Audio; le schede Cirrus sono state recentemente (forum in rete alla mano) protagoniste di problemi su macchine Apple utilizzanti BootCamp che hanno compreso una forbice che va dall’assenza totale di suono, alla gestione di suono esercitata a volume eccessivamente basso.
In alcuni forum si è parlato di un problema software risolvibile utilizzando per le schede Cirrus i drivers della Realtek.
La Cirrus pare abbia poi posto rimedio al problema (che ha suscitato a suo tempo fervide proteste da parte degli sfortunati Bootcampisti possessori di Mac dotati delle sue schede), effettivamente sul Mac del mio cliente il suono su Xp viene riprodotto, ma evidentemente si tratta di una soluzione utile solo per un uso standard della macchina.
Infatti se si oltrepassa il limite dello standard utilizzando un programma come il Dragon Naturally Speaking, la scheda audio non è più in grado di lavorare (neanche con i driver Realtek).
Evidentemente la qualità audio richiesta da un programma di riconoscimento vocale è ancora troppo alta, rispetto a quella che la Cirrus è riuscita a raggiungere per risolvere i problemi di volume denunciati dagli utenti Mac che utilizzano Boot Camp.
L’ alternativa che resta dunque è provare, da Leopard, il MacSpeech e sperare che il lavoro della Cirrus sul lato Apple sia stato migliore.
E’ forse un azzardo, ma prima di rassegnarsi a utilizzare il riconoscimento vocale solo su pc, è utile provarci.
In post successivi racconterò gli sviluppi di questa vicenda.

Se hai bisogno di assistenza per installare il software di cui parlo in questo articolo clicca qui

Thomas Pistoia

Dettatura tramite registratore

Mi scrive Simone: “so come funziona il programma di dettatura vocale, la mia domanda è questa: ma se io ho un file wave di una conferenza o di un intervista c’è un modo per trascriverlo automaticamente ?”

Sì, a patto che il file audio sia all’interno di un registratore vocale e, se il programma che utilizziamo è Dragon Naturally Speaking, meglio ancora se lo strumento è lo stesso fornito nella confezione del suddetto software.

In generale comunque la versione del software creata specificamente per il riconoscimento vocale tramite registratore (Dragon NaturallySpeaking 10 Preferred) consente la dettatura anche con microfono bluethoot e dispositivi palmari vari.

Lungi dal voler fare pubblicità consiglio dunque a Simone di dare un’ occhiata a questa pagina.

Thomas Pistoia



Dettatura e riconoscimento vocale

null

Un cliente medico aveva bisogno di un programma di dettatura, un software cioè, in grado di comprendere e apprendere la voce umana e le parole, riproducendole su un editor di testo.

Fantascienza ? No, anzi. Tutto si fonda sulla linguistica computazionale, la disciplina che studia il trattamento del linguaggio naturale tramite computer.
Per intenderci: quando scrivete un sms con il T9 del vostro cellulare state utilizzando un’applicazione fondata su questa materia.
Non mi dilungo: diciamo che la linguistica computazionale crea sistemi che aiutano i calcolatori a comprendere il linguaggio umano, e dal complesso dipanarsi di questa disciplina nascono software come Dragon Naturally Speaking, che ho consigliato al cliente, aiutandolo poi a installarlo e a utilizzarlo.

Si tratta di un software proprietario, peraltro leader nel settore.
Bisogna aggiungere che purtroppo l’Open Source non si è ancora occupato con impegno di questi tipo di applicazioni. Vi sono sì, dei programmi di lettura, che consentono al pc di leggere testi con l’ausilio di una voce sintetica o simulata, ma non esiste ancora un programma libero che consenta al computer di scrivere efficacemente sotto dettatura.

Per ora dunque “accontentiamoci” di Dragon Naturally Speaking.
Completo e compatibile con tutti gli editor più diffusi, il software possiede un sistema di autoapprendimento che comincia subito dopo l’installazione.
La prima cosa che Dragon deve fare è imparare a riconoscere la nostra voce (il cosiddetto riconoscimento vocale). Per cui ci invita a leggere dei brani (utilizzando ad esempio un libro di Beppe Severgnini oppure il Pinocchio di Collodi). Mentre leggiamo, parlando nel microfono, Dragon calibra i volumi, imposta la scheda audio e memorizza la nostra voce e la nostra pronuncia.

Esistono anche versioni del programma dedicate a professioni specifiche (ad es. medici e avvocati), impostate su vocabolari tecnici particolari. In tutti i casi, tramite la funzione che consente di aggiungere nuovi lemmi è possibile per l’utente creare un proprio specifico dizionario, personalizzando così il software e le sue funzioni.

E’ inoltre possibile insegnare a Dragon il riconoscimento della nostra voce tramite registratore vocale. Non solo, possiamo fargli memorizzare anche alcuni comandi che possono servirci nelle gestione del nostro Pc (per esempio, pronuncio nel microfono la parola “internet” e si apre subito il mio browser).

Insomma, il prezzo, date anche le particolari funzioni del programma, non è proibitivo; il risultato è che certamente non è ancora possibile abbandonare del tutto la tastiera, ma si possono ottenere comunque degli ottimi risultati in fatto di praticità, risparmio di tempo e qualità del lavoro.

Per chi volesse approfondire, il sito ufficiale del Dragon Naturally Speaking lo trovate cliccando qui.

Per chi invece, avesse bisogno di consulenza o di qualche lezione per imparare a utilizzarlo l’invito è quello di contattarci :-)

Thomas Pistoia

La tua azienda ha bisogno di un sito internet ? Richiedi qui il tuo preventivo !