Programavimas

Klaviatūra? Kaip nepakartojama

Balso paieškos ir balsu valdomos programinės įrangos era jau atėjo. Kaip kūrėjas gyvenu ir mirsiu naudodamas klaviatūrą, bet jau matau ženklus: kaip, pavyzdžiui, daugelis žmonių kalbuosi su savo „Android“ telefonu (pavyzdžiui, „Naršyti žemiausiuose [arba„ Starbucks “ar„ Harris Teeter “]) gauti nuorodas.

Mary Meeker 2016 m. Interneto tendencijų ataskaitoje ji praneša, kad „Google Voice“ paieškos užklausos nuo 2010 m. Išaugo septynis kartus. Aš taip pat pastebėjau, kad mano 12-metis sūnus beveik visas savo paieškas atlieka balsu - ir mano draugė man taip rašo reguliariai. Be to, įmonė, kurioje dirbu, „Lucidworks“ neseniai paskelbė apie naują partnerystę su IBM, siekdama integruoti „Watson“ ir teksto į kalbą galimybes į mūsų įmonės paieškos produktą.

Ši technologija veikia daug geriau nei anksčiau, ir ją lengviau integruoti į programas. Jei kuriate „Android“ ar „iOS“, galite lengvai prisijungti prie kalbos atpažinimo API. Tačiau kalbos atpažinimas neprasideda ir nesibaigia paprastomis „kalbos į tekstą“ ir balso komandomis.

Suprasti paieškos tikslą yra labai kontekstinė užduotis, ypač kalbant kalbą. Be to, žmonės paprastai vartoja daugiau žodžių natūralia šnekamąja kalba nei tada, kai susiduria su paieškos juosta. Sakytinėje kalboje yra daugiau „triukšmo žodžių“ nei įprastoje tekstinėje paieškoje.

Tai reikšmingi dirbtinio intelekto iššūkiai. Tačiau kai mes įveiksime konteksto problemą, kūrėjai sužinos, kad balsu galima nuveikti daugiau nei su tekstu. Emocinis kontekstas vaidins svarbų vaidmenį. Jei ieškote degalinės, ar norite pigiausios ar artimiausios? Jausmingas jūsų balso turinys tai gali reikšti. Aišku, galbūt patikslinsi, bet gali ir neprireikti.

Jūsų šneki ateitis

Balso valdoma epocha nėra vien apie paieškas. Tai paveiks visą mūsų sąveikos su kompiuteriais būdą. Ne per tolimoje ateityje klaviatūros bus laikomos „keistomis“, kaip Scotty jas puikiai apibūdino „Žvaigždžių žygyje IV“.

Tačiau tam poslinkiui taip pat reikia visiškai naujos vartotojo sąsajos. Štai senovės iliustracija to, ką turiu omenyje: Kai pasirodė „Windows 95“, IBM integravo balso komandas į savo kompiuterius. Tuo metu dirbau „Office Depot“ pardavėju ir greitai paaiškėjo, kaip nepraktiškos balso komandos. Languota sąsaja visiškai netinka šiai sąveikos formai.

Aš turiu omenyje, kaip po velnių jūs perkelsite langą iš kito lango kelio ir pakeisite jų abiejų dydį, kad jie būtų veiksmingai pritaikyti ekrane balso komandomis? Jūs neturite. Tu apskritai grioviu tuos langus (ir tikriausiai „Windows“). Balso valdoma vartotojo sąsaja nenaudoja tų pačių motyvų. Niekada nematote lango „Star Trek“ sąsajos.

Kalbėdami apie „Žvaigždžių kelionę“, kai žmonės pradeda koduoti ar daryti kažką techniško, jie visada persijungia į liečiamąją sąsają (gerai, ne visai lytėjimo - tai labiau panašu į mikrobangų krosnelės klaviatūrą, padengtą art nouveau schemomis). Bet ar būtina grįžti prie „spausdinimo“? Tiesa, neįsivaizduoju balso sąsajos kodavimui „Scala“. Gal bus sukurtos naujos kalbos (be skliaustų, skirtingai nei „Scala“ - ir mano straipsniai), specialiai pritaikytos balsui.

Svetainės tikrai neatrodys vienodos ir pasiūlys naujų naršymo paradigmų. Sakysite „parodyk man batų sandorius“, o tai, ką grąžinsi, tikriausiai bus geriau organizuota ir kontekstui jautresnė nei jūsų vidutinė svetainė („sandoriai“ ir „batai“). Be to, nenorėsiu daug slinkti ar sakyti „kitas puslapis“, todėl sąveika turės būti individualizuota. Sistema jau turėtų žinoti, kad noriu vyriškų batų, o dėl savo Achilo sausgyslės nenoriu batelių su aukštakulniais. Gal ji žino, kad man labiau patinka tamsios spalvos. Gal aš tai pasakiau, o gal tai analizavo mano elgesį.

Ar tai iš viso svetainė? Žinoma, jei apsipirksiu batus, norėčiau vizualiai pavaizduoti, bet jei kalbu, galbūt mašina kalba atgal. Gal tai rodo man batus, tada klausia: "Ar jūs ieškote tam tikro tipo batų? Kokiam tikslui šie batai yra skirti? Ar nešiojate juos žygiams pėsčiomis, ar į vakarėlį?"

Paieškos balsu era pakeis viską nuo mūsų sąveikos su mašinomis iki kodavimo. Daugelis mums reikalingų technologijų jau yra prieinamos šiandien, o kitos dar neišradinėjamos. Poveikis vartotojo sąsajoms gali būti gilesnis nei perėjimas nuo skylių kortelių prie klaviatūrų.

Šis platus pokytis įvyks ne iš karto. Šiandien ne ta diena, kai reikia išmesti klaviatūrą. Tačiau gali būti ta diena, kai pradėsite galvoti apie savo svetainės pertvarkymą, kad ji būtų tikrai prieinama balsu.