Kas ir runas pazīšana?

Jūsu balss izmantošana kā ievades metode

Runas atpazīšana ir tehnoloģija, kas ļauj runāšanu ievadīt sistēmās. Jūs runājat ar datoru, tālruni vai ierīci, un tas izmanto to, ko jūs teicāt kā ievadi, lai aktivizētu kādu darbību. Šī tehnoloģija tiek izmantota, lai aizstātu citas ievades metodes, piemēram, rakstīt, noklikšķinot vai atlasot citus veidus. Tas ir līdzeklis, lai ierīces un programmatūra būtu lietotājdraudzīgāka un palielinātu produktivitāti.

Ir daudz lietojumprogrammu un apgabalu, kur tiek izmantota runas atpazīšana, ieskaitot militāro, kā palīdzību cilvēkiem ar traucējumiem (iedomājieties personu ar kropliem vai bez rokām vai pirkstiem), medicīnas jomā, robotikās uc Tuvākajā nākotnē, gandrīz visi būs pakļauti runas atpazīšanai, jo tā izplatās starp parastajām ierīcēm, piemēram, datoriem un mobilajiem telefoniem.

Daži viedtālruņi interesanti izmanto runas atpazīšanu. Piemēri iPhone un Android ierīcēm. Ar to jūs varat sākt sarunu ar kontaktu, vienkārši saņemot balss norādījumus, piemēram, "Zvanu birojs". Var arī izklaidēt citas komandas, piemēram, "Ieslēgt Bluetooth".

Problēmas ar runas pazīšanu

Runas atpazīšana tā versijā, kas pazīstama kā Runa uz tekstu (STT), jau ilgu laiku tiek izmantota, lai tulko vārdos vārdus tekstā. "Jūs runājat, tas ir veids", kā ViaVoice teiktu savā kastē. Bet STT ir viena problēma, kā mēs to zinām. Vairāk nekā 10 gadus atpakaļ es mēģināju ViaVoice un nedēļā nedarīja savu datoru. Kāpēc Tas bija ārkārtīgi neprecīzs, un es beidzot pavadīju vairāk laika un enerģijas, runājot un labojot, nevis rakstīt visu. ViaVoice ir viens no labākajiem nozarē, tāpēc iztēlojieties pārējo. Tehnoloģija ir nogatavinājusies un uzlabojusies, bet runas teksts joprojām liek cilvēkiem uzdot jautājumus. Viena no galvenajām grūtībām ir milzīgas atšķirības starp vārdiem izteiktajiem cilvēkiem.

Runas atpazīšanā domātas ne visas valodas, un bieži tiek atbalstītas arī valodas, kā arī angļu valodas. Tā rezultātā lielākā daļa ierīcēs, kurās darbojas runas atpazīšanas programmatūra, pamatoti darbojas tikai angļu valodā.

Aparatūras prasību kopums dažos gadījumos ir grūti izvietot runas atpazīšanu. Jums ir nepieciešams pietiekami inteliģents mikrofons, lai filtrētu fona troksni, bet tajā pašā laikā pietiekami spēcīgs, lai dabiski atskaņotu balsi.

Runājot par fona troksni, tas var izraisīt visas sistēmas izgāšanos. Rezultātā runas atpazīšana daudzos gadījumos neizdodas, jo trokšņi ir ārpus lietotāja vadības.

Runas atpazīšana ir labāka kā jaunu mobilo tālruņu un komunikāciju tehnoloģiju, piemēram, VoIP, ievades metode kā masu teksta ievades produktivitātes rīks.

Runas pazīšanas lietojumi

Šī tehnoloģija ir kļuvusi populāra daudzās jomās, un tā ir veiksmīga:

- Ierīces vadība. Vienkārši sakot "OK Google" ar Android tālruni, tiek aktivizēta sistēma, kas visas ir jūsu balss komandu ausis.

- Auto Bluetooth sistēmas. Daudzas automašīnas ir aprīkotas ar sistēmu, kas savieno radio mehānismu ar viedtālruni, izmantojot Bluetooth. Pēc tam jūs varat veikt un saņemt zvanus, nepieskaroties viedtālrunim, un pat varat izsaukt numurus, vienkārši sakot tos.

- Balss transkripcija. Vietās, kur cilvēkiem ir daudz jāieraksta, daži inteliģentie programmatūra uztver šos vārdus un pārraksta tos tekstā. Tas ir aktuāls noteiktā tekstapstrādes programmatūrā. Balss transkripcija darbojas arī ar vizuālo balss pastu .