Makipag-usap sa Akin Computer: Tumatakbo ang Control ng Voice

Kung ang mga di-inaasahang mga pakete ay magsisimulang magpakita sa iyong pinto, maaaring gusto mong magkaroon ng isang salita sa isa sa iyong mga smart device.

Mas maaga sa buwan na ito, tinanong ng isang anim na taong gulang sa Dallas ang kanyang pamilya Amazon Echo matalinong tagapagsalita para sa isang bahay-manika. At si Alexa, ang Siri-tulad ng artipisyal na katulong ng Amazon, kaagad iniutos ng isa sa kanilang bahay.

Isang balita sa balita sa San Diego ang kinuha ang kuwento, at di-sinasadyang inulit ito noong sinabi ng isa sa mga balita ng mga anchor: "Gustung-gusto ko ang maliit na batang babae, na sinasabi ang 'order ako sa isang bahay na gintong Britanya.'" Nakarating na ito, maraming iba pang mga device sa Amazon sa mga tahanan San Diego sinubukang bumili ng mas maraming mga bahay-manok.

CW6 ulat ng balita sa San Diego sa pagbili ng aksidente na dollhouse ng Alexa.

{youtube}oI2KLIULjXc{/youtube}

Ang kwento ay maaaring tunog na pamilyar sa kahit sino na sinubukan na magkaroon ng isang pag-uusap sa Siri Apple o Microsoft's Cortana. Ang aming mga aparato ay naging napakahusay sa pakikinig sa amin, ngunit hindi palaging nangangahulugan na nauunawaan nila.

Tinukoy ng mga mananaliksik sa Microsoft kamakailan ito bilang potensyal na problema sa pakikipag-usap ng mga interface ngayon: ibinebenta sila bilang mga "matalinong" katulong, na may matalino na biro at makamundong kaalaman, subalit madalas nilang binigo kami sa kanilang kakulangan ng sentido komun.


innerself subscribe graphic


Sa isang maliit na pag-aaral, natuklasan ng mga mananaliksik na ang mga taong patuloy na nakikipag-usap sa kanilang mga digital na katulong sa paglipas ng panahon ay ang mga nagsimula sa pinakamababang inaasahan.

Ano ang talagang ginagawa ng isang voice interface?

Kapag nagsasalita ka sa isang voice interface, mayroon itong:

  • "Marinig" ang tunog ng iyong boses, at makilala ito mula sa ingay sa background
  • malaman kung saan ang bawat salita ay nagsisimula at nagtatapos, hindi papansin ang iyong "umms" at "ahhs"
  • tumutugma sa tunog ng bawat salita sa isang salita sa diksyunaryo, pagpili ng tama mula sa konteksto kung mayroon homophones
  • tama ang kahulugan ng kahulugan ng buong pangungusap
  • bumuo ng isang makabuluhan at kapaki-pakinabang na tugon na tumutugma sa iyong kahilingan.

Ang bawat isa sa mga ito ay isang kumplikadong teknikal na hamon, at iba't ibang mga kumpanya ng teknolohiya ay nag-unlad sa iba't ibang lugar.

Maganda ang Google Now sa pagbibigay ng may-katuturang mga tugon sa malawak na hanay ng mga kahilingan dahil ito ay nakikinabang mula sa mga troso ng Google ng data tungkol sa web, at iyong mga personal na aktibidad, kung gumagamit ka ng mga serbisyo ng Google.

Ang Amazon Echo ay partikular na mahusay sa pagdinig ng iyong mga kahilingan mula sa isang maingay na silid, salamat sa isang pag-cancel ng ingay sa pag-cancel ng hanay ng mikropono na malayo sa field. Siyempre, ito ay mahusay din sa paggawa ng mga pagbili sa pamamagitan ng Amazon.

Sa nakalipas na ilang taon, ang mga interface ng boses ay naging mas mahusay sa pag-unawa sa pang-araw-araw o "natural" na pagsasalita sa halip na lamang ang mga stilted at maingat na worded command. Mas mahusay pa rin ang mga ito sa paghawak ng mga simpleng tanong, tulad ng "sino ang naglalaro sa Australian Open?", At malamang na nakikipagpunyagi sa mas kumplikadong mga kahilingan, tulad ng "sino ang naglalaro sa Australian Open sa unang pagkakataon ngayong taon?", At follow-up mga katanungan, tulad ng "ay ulan sa panahon ng finals?".

Ang sitwasyon ay mas maraming halo-halong para sa mga wika bukod sa Ingles: habang ang Siri ay sumusuporta sa higit sa 40 na mga wika at mga dialekto, sa ngayon ang Alexa ay magagamit lamang sa Ingles at Aleman. Ngunit ang lahat ng mga tampok na ito ay patuloy na nagpapabuti.

Kung saan ang mga interface ng boses mautal

Gayon din ang mga interface ng boses sa lalong madaling panahon ay kukuha ng lahat ng aming teknolohiya, tulad ng hinulaang sa pelikula Kanya? Si Gartner, isang kumpanya sa pananaliksik na teknolohiya, ay may forecast na sa susunod na taon, ang 30% ng aming mga pakikipag-ugnayan sa teknolohiya ay magiging pag-uusap na may mga interface na pinapagana ng boses.

Ngunit may mga limitasyon ang mga interface ng boses, at hindi lahat ay maaaring malutas sa pamamagitan ng mas mahusay na teknolohiya.

Ang boses ay isang sentral na paraan ng pakikipag-ugnay sa teknolohiya sa Spike Jonze's film Her.

{youtube}ne6p6MfLBxc{/youtube}

Ang polusyon ng ingay ay isa sa mga pangunahing hadlang. Makilala ba ng iyong aparato ang iyong sinasabi mula sa ingay sa paligid mo? Maaaring makatulong ang teknolohiya sa iyon, kabilang ang pagbabawas ng ingay, personalized na pagkilala sa boses at pagbabasa ng labi.

Ngunit ano ang tungkol sa ingay sa background na iyong nililikha para sa iba sa pamamagitan ng pakikipag-usap sa iyong smart device? Isipin ang isang taong nakaupo sa tabi mo sa opisina - o sa isang eroplano - nakikipag-chat sa Siri habang sinusubukan mong basahin, at makikita mo kung bakit ang mga interface ng boses ay maaaring hindi laging katanggap-tanggap sa lipunan.

Ang isa pang hanay ng mga isyu ay nagmula sa mga kahilingan sa isip ng mga interface ng boses. Ang pag-aaral na gumamit ng isang voice-based na sistema ay maaaring maging mahirap, lalo na kung walang screen, tulad ng sa Amazon Echo.

Kung naranasan mo na ang isang bangko o isang kompanya ng telepono, alam mo ang kahabag-habag na kumbinasyon ng konsentrasyon at pag-inom na nagmumula sa pakikinig sa isang synthesized na listahan ng boses ang lahat ng iyong mga pagpipilian habang naghihintay ka para sa isa na kailangan mo at subukan hindi upang makihalubilo sa kanila up. Ang mga tradisyunal na graphical na mga interface ay maiiwasan ang problemang ito sa pamamagitan ng pagpapakita sa iyo ng mga magagamit na opsyon at pagpapaalam mong mabilis na i-tap ang iyong pinili.

Matapos mong matutunan ang mga utos ng boses, ang paggamit sa mga ito ay maaaring nakakagambala. Natuklasan ng mga mananaliksik na ang mga utos ng boses derail ang iyong tren ng pag-iisip higit sa isang mouse at keyboard.

Ito ay partikular na mapanganib para sa mga interface ng in-car na boses: isang pares ng pag-aaral mula sa Unibersidad ng Utah ang natagpuan na ang mga drayber ay ginulo para sa hanggang sa 27 segundo pagkatapos ng paggamit ng mga utos ng boses.

University of Utah / AAA Foundation para sa Trapiko sa Kaligtasan pananaliksik sa driver distraction.

{vimeo}108281698{/vimeo}

Paghahanap ng boses nito?

Kaya ang mga interface ng boses ay malamang na hindi sakupin ang lahat, ngunit makakahanap sila ng mga kapaki-pakinabang na niches sa ating buhay. Ang mga ito ay karaniwan na sa mga kotse, kung saan sila ay inaasahan na maging mas mababa distracting bilang ang teknolohiya ay nagpapabuti.

Sa kusina, maaari mong hilingin sa Alexa na makipag-usap sa iyo sa pamamagitan ng isang recipe o i-update ang iyong listahan ng shopping habang ang iyong mga kamay ay abala pagluluto. Sa virtual at augmented na katotohanan, ang mga interface ng boses ay maaaring magpapahintulot sa iyo na kontrolin ang sistema kapag hindi mo makita ang iyong mga kamay sa lahat.

Sa pag-aaral ng wika, maaari silang magamit para sa pagsasanay ng pagbigkas. Pinakamahalaga, ang mga interface ng boses ay tumutulong sa mga gumagamit na may mga kapansanan sa motor, RSI o dyslexia upang mapaglabanan ang kanilang mga kapansanan.

Ang mga interface ng boses ay isang pinakahihintay na teknolohiya, at may mga magandang dahilan upang isipin na ang kanilang oras ay dumating sa wakas. Tandaan lamang na hindi pa sila maaaring maging matalino habang sila tunog. At baka gusto mong maglagay ng PIN code sa mga pagbili ng boses kung ang mga bata ay nasa paligid.

Ang pag-uusap

Tungkol sa Ang May-akda

Fraser Allison, PhD Kandidato sa Human-Computer Interaction, University ng Melbourne

Ang artikulong ito ay orihinal na na-publish sa Ang pag-uusap. Basahin ang ang orihinal na artikulo.

Kaugnay na Mga Item

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf Market at Amazon