Paano Alam ng Isang Computer Kung Saan Ka Hinahanap?

Gunigunihin ang pagmamaneho ng kotse, gamit ang isang projection display ng ulo-up sa windshield upang mag-navigate sa pamamagitan ng isang hindi pamilyar na lungsod. Ito ay augmented reality (AR); ang impormasyon ay ginagamit upang hindi lamang gabayan ka sa isang ruta, kundi pati na rin upang alertuhan ka sa kapansin-pansin na impormasyon sa iyong kapaligiran, tulad ng mga cyclists o pedestrian. Ang tamang pagkakalagay ng virtual na nilalaman ay hindi lamang mahalaga, ngunit marahil isang bagay ng buhay at kamatayan.

Ang impormasyon ay hindi maaaring ikubli ang iba pang materyal, at dapat ipakita nang sapat na mahaba para maintindihan mo ito, ngunit hindi masyadong mas matagal kaysa iyon. Ang mga sistema ng computer ay kailangang gumawa ng mga pagpapasiya na ito sa real-time, nang walang nagiging sanhi ng anumang impormasyon na nakagagambala o nakakagambala. Tiyak na ayaw namin ng isang babala tungkol sa isang siklista na tumawid sa harap ng kotse upang ikubli ang sarili sa siklista!

Bilang isang tagapagpananaliksik sa AR, gumugugol ako ng maraming oras na sinusubukan upang malaman kung paano makakuha ng tamang impormasyon papunta sa isang screen ng gumagamit, sa tamang lugar, sa tamang sandali lamang. Natutunan ko na ang pagpapakita ng napakaraming impormasyon ay maaaring malito ang gumagamit, ngunit hindi nagpapakita ng sapat na maaaring mag-render ng application na walang silbi. Kailangan nating hanapin ang matamis na lugar sa pagitan.

Ang isang mahalagang elemento ng ito, lumiliko out, ay alam kung saan hinahanap ang mga gumagamit. Lamang pagkatapos ay maaari naming maihatid ang impormasyon na nais nila sa isang lokasyon kung saan maaari nilang iproseso ito. Ang pagsasaliksik natin ay nagsasangkot sa pagsukat kung saan ang hinahanap ng user ang tunay na eksena, bilang isang paraan upang makatulong na magpasya kung saan ilalagay ang virtual na nilalaman. Sa AR poised upang makalusot maraming mga lugar ng aming mga buhay - mula sa pagmamaneho sa trabaho sa libangan - kailangan namin upang malutas ang problemang ito bago kami makakaasa sa AR upang magbigay ng suporta para sa malubhang o kritikal na pagkilos.

Pagtukoy kung saan ilalagay ang impormasyon

Makatutulong na magkaroon ng impormasyon kung saan hinahanap ng gumagamit. Kapag nagna-navigate, ang isang gumagamit ay maaaring tumingin sa isang gusali, kalye o iba pang tunay na bagay upang ibunyag ang nauugnay na virtual na impormasyon; alam ng system upang itago ang lahat ng iba pang mga display upang maiwasan ang cluttering ang nakikita eksena.


innerself subscribe graphic


Ngunit paano natin malalaman kung ano ang hinahanap ng isang tao? Ito ay lumalabas na ang mga nuances ng pangitain ng tao ay nagbibigay-daan sa amin upang suriin sa mata ng isang tao at kalkulahin kung saan sila ay naghahanap. Sa pagpapares ng mga data na may mga camera na nagpapakita ng field ng view ng isang tao, maaari naming matukoy kung ano ang nakikita ng tao at kung ano ang kanyang hinahanap.

Ang mga sistema ng pagsubaybay sa mata ay unang lumitaw sa 1900s. Orihinal na sila ay karaniwang ginagamit upang pag-aralan ang mga pattern ng pagbabasa; ang ilan ay maaaring maging lubhang mapanghimasok para sa mambabasa. Higit pang mga kamakailan lamang, ang real-time na pagsubaybay ng mata ay lumitaw at nagiging mas abot-kaya, mas madaling gamitin at mas maliit.

Ang mga tracker ng mata ay maaaring naka-attach sa screen o isinama sa mga naisusuot na baso o mga display na nakabitin sa ulo. Sinusubaybayan ang mga mata gamit ang isang kumbinasyon ng camera, projection at computer vision algorithm upang kalkulahin ang posisyon ng mata at ang gaze point sa isang monitor.

Karaniwang tinitingnan namin ang dalawang hakbang kapag sinusuri ang data ng pagsubaybay sa mata. Ang una ay tinatawag na a pagkapirmi, at ginagamit upang ilarawan kapag nag-pause kami ng aming tingin, madalas sa isang kawili-wiling lokasyon sa isang eksena dahil nahuli namin ang aming pansin. Ang pangalawa ay a saging, isa sa mabilis na mga paggalaw ng mata na ginagamit upang italaga ang tingin. Ang mga maikling panahon ng pag-aayos ay sinusundan ng mabilis na paggalaw, na tinatawag na saccades. Talaga, ang aming mga mata mabilis na dart mula sa lugar sa lugar ng pagkuha ng mga piraso ng impormasyon tungkol sa mga bahagi ng isang eksena. Ang aming talino ay pagkatapos ay ilagay ang impormasyon mula sa mga pag-aayos na ito magkasama upang bumuo ng isang visual na imahe sa aming mga isip.

{youtube}tdFIvRMvFQI{/youtube}

Pinagsasama ang pagsubaybay ng mata sa AR

Kadalasan ang nilalaman ng AR ay naka-angkop sa isang bagay o lokasyon sa real-mundo. Halimbawa, ang isang virtual na label na naglalaman ng isang pangalan ng kalye ay dapat na ipinapakita sa kalye na iyon. Sa isip, nais naming lumitaw ang mga label ng AR malapit sa tunay na bagay na nauugnay dito. Ngunit kailangan din naming mag-ingat na huwag ipa-overlap ang maramihang AR label at maging hindi mababasa. Mayroong maraming mga diskarte sa pamamahala ng pagkakalagay ng label. Sinusubukan namin ang isang pagpipilian: pagkalkula kung saan nakatingin ang tao sa tunay na eksena at pagpapakita ng mga label ng AR lamang sa lugar na iyon.

Sabihin, halimbawa, ang isang gumagamit ay nakikipag-ugnayan sa isang mobile na application na tumutulong sa kanya na mamili para sa mababang calorie cereal sa grocery store. Sa AR application, ang bawat cereal ay may calorie na impormasyon na nauugnay dito. Kaysa sa pisikal na pagpili ng bawat cereal box at pagbabasa ng nutritional content, ang user ay maaaring hawakan ang kanyang mobile device at ituro ito sa isang partikular na kahon ng cereal upang ihayag ang may-katuturang impormasyon.

Ngunit mag-isip tungkol sa kung gaano masikip ang pintuan ng cereal ng tindahan ay may iba't ibang mga pakete. Kung walang paraan upang pamahalaan ang pagpapakita ng mga label ng AR, ang mga label ng calorie na impormasyon para sa lahat ng mga kahon ng cereal ay ipapakita. Imposibleng makilala ang nilalaman ng calorie para sa cereal na interesado siya.

Sa pamamagitan ng pagsubaybay sa kanyang mga mata, maaari naming matukoy kung aling indibidwal na kahon ng cereal ang hinahanap ng gumagamit. Pagkatapos ay ipapakita namin ang calorie na impormasyon para sa partikular na cereal. Kapag binago niya ang kanyang tingin sa isa pang kahon, ipinapakita namin ang mga numero para sa susunod na isinasaalang-alang niya. Ang kanyang screen ay walang labis, ang impormasyong gusto niya ay madaling magagamit at kapag nangangailangan siya ng karagdagang impormasyon, maaari naming ipakita iyon.

Ang ganitong uri ng pag-unlad ay ginagawa itong kapana-panabik na oras para sa AR research. Ang aming kakayahang pagsamahin ang mga eksena sa real-world na may mga graphics ng computer sa mga mobile display ay nagpapabuti. Pinupukaw nito ang inaasam-asam ng paglikha ng mga nakamamanghang bagong mga application na nagpapalawak ng aming kakayahang makipag-ugnay, natututo at kinagigiliwan ng mundo sa paligid natin.

Tungkol sa Ang May-akda

Ann McNamara, Associate Professor of Visualization, Texas A & M University

Ang artikulong ito ay orihinal na na-publish sa Ang pag-uusap. Basahin ang ang orihinal na artikulo.

Mga Kaugnay Books

at

masira

Salamat sa pagbisita InnerSelf.com, Kung saan mayroon 20,000 + mga artikulong nagbabago sa buhay na nagtataguyod ng "Mga Bagong Saloobin at Bagong Posibilidad." Ang lahat ng mga artikulo ay isinalin sa 30+ wika. sumuskribi sa InnerSelf Magazine, na inilathala linggu-linggo, at Araw-araw na Inspirasyon ni Marie T Russell. InnerSelf Magazine ay nai-publish mula noong 1985.