Programavimas

Peržiūra: „Google Cloud AI“ suteikia galimybę mokytis mašinoje

„Google“ turi vieną didžiausių mašininio mokymosi paketų pramonėje, šiuo metu orientuotą į savo „Google Cloud AI“ ir „Machine Learning Platform“. „Google“ prieš daugelį metų išplėtojo „TensorFlow“ kaip atvirojo kodo programą, tačiau „TensorFlow“ vis dar yra pati brandžiausia ir plačiausiai cituojama giluminio mokymosi sistema. Panašiai „Google“ prieš daugelį metų išplėtojo „Kubernetes“ kaip atvirojo kodo versiją, tačiau ji vis dar yra dominuojanti konteinerių valdymo sistema.

„Google“ yra vienas iš geriausių įrankių ir infrastruktūros šaltinių kūrėjams, duomenų mokslininkams ir mašininio mokymosi ekspertams, tačiau istoriškai „Google AI“ dar nebuvo toks patrauklus verslo analitikams, kuriems trūksta rimtų duomenų mokslo ar programavimo pagrindų. Tai pradeda keistis.

„Google Cloud“ dirbtinio intelekto ir mašininio mokymosi platformoje yra dirbtinio intelekto blokai, dirbtinio intelekto platforma ir greitintuvai bei dirbtinio intelekto sprendimai. PG sprendimai yra gana nauji ir skirti verslo vadybininkams, o ne duomenų mokslininkams. Jie gali apimti „Google“ ar jos partnerių konsultacijas.

Iš anksto apmokyti, bet pritaikomi dirbtinio intelekto blokai gali būti naudojami be intymių žinių apie programavimą ar duomenų mokslą. Nepaisant to, kvalifikuoti duomenų mokslininkai juos dažnai naudoja dėl pragmatiškų priežasčių, iš esmės norėdami atlikti darbus be išsamių modelių mokymų.

Dirbtinio intelekto platforma ir greitintuvai paprastai skirti rimtų duomenų mokslininkams, todėl jiems reikalingi kodavimo įgūdžiai, žinios apie duomenų rengimo būdus ir daug laiko. Aš rekomenduoju ten nuvykti tik išbandžius atitinkamus statybinius elementus.

„Google Cloud“ AI pasiūlymuose vis dar trūksta nuorodų, ypač rengiant duomenis. Artimiausias dalykas, kurį „Google Cloud“ turi duomenų importavimo ir tvarkymo paslaugai, yra „Trifacta“ trečiosios šalies „Cloud Dataprep“; Išbandžiau prieš metus ir buvau priblokšta. „Cloud AutoML Tables“ įmontuota funkcijų inžinerija yra perspektyvi, tačiau būtų naudinga turėti tokią paslaugą kitiems scenarijams.

Siuvinėta dirbtinio intelekto pusė yra susijusi su etika ir atsakomybe (arba jos nebuvimu), taip pat su nuolatiniais modelio šališkumais (dažnai dėl šališkų duomenų, naudojamų mokymams). „Google“ paskelbė savo AI principus 2018 m. Tai yra nebaigtas darbas, tačiau tai yra gairių pagrindas, kaip aptarta naujausiame tinklaraščio įraše „Atsakingas AI“.

Dirbtinio intelekto rinkoje yra didelė konkurencija (daugiau nei tuzinas pardavėjų) ir didelė konkurencija viešojoje debesų rinkoje (daugiau nei pusė tuzino patikimų pardavėjų). Norėdamas teisingai palyginti palyginimus, turėčiau parašyti straipsnį bent penkis kartus ilgiau nei šis, todėl, kiek nekenčiu jų nepalikti, turėsiu praleisti daugumą produktų palyginimų. Geriausiam akivaizdžiam palyginimui galiu apibendrinti: AWS daro didžiąją dalį to, ką daro „Google“, taip pat yra labai gera, tačiau paprastai taiko didesnes kainas.

„Google Cloud AI“ statybiniai blokai

„Google Cloud AI“ statybiniai blokai yra lengvai naudojami komponentai, kuriuos galite įtraukti į savo programas, kad pridėtumėte matymo, kalbos, pokalbių ir struktūrizuotų duomenų. Daugelis dirbtinio intelekto blokų yra iš anksto parengti neuroniniai tinklai, tačiau juos galima pritaikyti perkėlimo mokymuisi ir neuroninių tinklų paieškai, jei jie neatitinka jūsų poreikių. „AutoML Tables“ yra šiek tiek kitoks, nes jis automatizuoja procesą, kurį duomenų mokslininkas naudotų, norėdamas rasti geriausią lentelių duomenų rinkinio mašininio mokymosi modelį.

„AutoML“

„Google Cloud AutoML“ paslaugos teikia pritaikytus giliuosius neuroninius tinklus kalbų porų vertimui, teksto klasifikavimui, objektų aptikimui, vaizdų klasifikavimui ir vaizdo objektų klasifikavimui bei sekimui. Jie reikalauja pažymėtų duomenų mokymams, tačiau nereikalauja didelių žinių apie gilų mokymąsi, perkėlimo mokymąsi ar programavimą.

„Google Cloud AutoML“ tinkina jūsų kovoje patikrintus, labai tikslius „Google“ giliųjų neuronų tinklus jūsų pažymėtiems duomenims. Užuot pradėjęs nuo nulio mokydamas modelius iš savo duomenų, „AutoML“ įgyvendina automatinį giluminio perkėlimo mokymąsi (tai reiškia, kad jis pradedamas nuo esamo gilaus neuroninio tinklo, mokomo pagal kitus duomenis) ir neuroninės architektūros paiešką (tai reiškia, kad randa tinkamą papildomų tinklo sluoksnių derinį ) kalbų porų vertimui ir kitoms aukščiau išvardytoms paslaugoms.

Kiekvienoje srityje „Google“ jau turi vieną ar kelias iš anksto apmokytas paslaugas, pagrįstas giliais neuroniniais tinklais ir didžiuliais etikečių duomenų rinkiniais. Tai gali būti naudinga nepakeistiems jūsų duomenims, todėl turėtumėte tai išbandyti, kad sutaupytumėte laiko ir pinigų. Jei jie nedaro to, ko jums reikia, „Google Cloud AutoML“ padeda jums sukurti tokį modelį, kuris nereikalauja, kad jūs žinotumėte, kaip mokytis perkėlimo ar kaip kurti neuroninius tinklus.

Mokymasis perkelti siūlo du didelius privalumus, lyginant su neuroninio tinklo mokymu nuo nulio. Pirma, mokymui reikia daug mažiau duomenų, nes dauguma tinklo sluoksnių jau yra gerai apmokyti. Antra, jis treniruojasi daug greičiau, nes optimizuoja tik paskutinius sluoksnius.

Nors anksčiau „Google Cloud AutoML“ paslaugos buvo pateikiamos kartu kaip paketas, dabar jos yra nurodytos kartu su pagrindinėmis iš anksto apmokytomis paslaugomis. Tai, ką dauguma kitų kompanijų vadina „AutoML“, atlieka „Google Cloud AutoML Tables“.

Perskaitykite visą „Google Cloud AutoML“ apžvalgą

„AutoML“ lentelės

Įprastas duomenų mokslo procesas, susijęs su daugeliu regresijos ir klasifikavimo problemų, yra sudaryti duomenų lentelę mokymui, išvalyti ir paruošti duomenis, atlikti funkcijų inžineriją ir pabandyti mokyti visus tinkamus modelius transformuotoje lentelėje, įskaitant žingsnį optimizavimui. geriausių modelių hiperparametrai. „Google Cloud AutoML Tables“ gali automatiškai atlikti visą šį procesą, kai rankiniu būdu nustatote tikslinį lauką.

„AutoML Tables“ per „Google“ modelių zoologijos sodą automatiškai ieško struktūrizuotų duomenų, kad surastų geriausią modelį jūsų poreikiams, pradedant nuo linijinių / logistinių regresijos modelių, skirtų paprastesniems duomenų rinkiniams, iki patobulintų giliųjų, ansamblio ir architektūros paieškos metodų, skirtų didesniems, sudėtingesniems. Tai automatizuoja daugelio lentelių duomenų pirminių elementų, pvz., Skaičių, klasių, eilučių, laiko žymių ir sąrašų, funkcijų kūrimą ir padeda aptikti trūkstamas reikšmes, išskirtinius rodiklius ir kitas įprastas duomenų problemas ir rūpintis jomis.

Jos be kodo sąsaja nurodo visą mašininio mokymosi visą gyvenimą ciklą, todėl kiekvienam iš jūsų komandos lengva kurti modelius ir patikimai juos įtraukti į platesnes programas. „AutoML Tables“ pateikia išsamius įvesties duomenis ir modelio elgesio paaiškinimo funkcijas, taip pat apsaugines juosteles, kad būtų išvengta dažniausiai pasitaikančių klaidų. „AutoML Tables“ taip pat yra API ir nešiojamųjų kompiuterių aplinkose.

„AutoML Tables“ konkuruoja su AI be vairuotojo ir keletu kitų „AutoML“ diegimų ir sistemų.

Vision API

„Google Cloud Vision“ API yra iš anksto parengta mašininio mokymosi paslauga, skirta vaizdams suskirstyti į kategorijas ir išgauti įvairias funkcijas. Jis gali suskirstyti vaizdus į tūkstančius iš anksto apmokytų kategorijų, pradedant nuo bendrų daiktų ir vaizde rastų gyvūnų (pvz., Katės), iki bendrų sąlygų (pavyzdžiui, sutemus), iki konkrečių orientyrų (Eifelio bokštas, Didysis kanjonas), ir nustatyti bendras vaizdo savybes, pavyzdžiui, dominuojančias spalvas. Jis gali izoliuoti sritis, kurios yra veidai, tada taikyti geometrinę (veido orientacija ir orientyrai) ir emocinę analizę veidams, nors veidai nepripažįstami priklausančiais konkretiems žmonėms, išskyrus įžymybes (tam reikalinga speciali naudojimo licencija). „Vision“ API naudoja OCR, kad atpažintų vaizdų tekstą daugiau nei 50 kalbų ir įvairių tipų failus. Tai taip pat gali nustatyti produkto logotipus ir aptikti suaugusiesiems skirtą, smurtinį ir medicininį turinį.

Perskaitykite visą „Google Cloud Machine Learning“ API apžvalgą

Vaizdo intelekto API

„Google Cloud Video Intelligence“ API automatiškai atpažįsta daugiau nei 20 000 objektų, vietų ir veiksmų saugomame ir srautiniame vaizdo įraše. Jis taip pat išskiria scenos pokyčius ir išskiria turtingus metaduomenis vaizdo, kadro ar kadro lygiu. Be to, jis naudoja teksto aptikimą ir ištraukimą naudodamas OCR, aptinka aiškų turinį, automatizuoja subtitrus ir subtitrus, atpažįsta logotipus ir aptinka veidus, asmenis ir pozas.

„Google“ rekomenduoja „Video Intelligence“ API išskleisti metaduomenis jūsų vaizdo įrašų turiniui indeksuoti, tvarkyti ir ieškoti. Jis gali perrašyti vaizdo įrašus ir generuoti uždarus antraštes, taip pat pažymėti ir filtruoti netinkamą turinį - visa tai ekonomiškiau nei žmonių perrašinėtojai. Naudojimo atvejai apima turinio moderavimą, turinio rekomendacijas, medijos archyvus ir kontekstines reklamas.

Natūralios kalbos API

Natūralios kalbos apdorojimas (NLP) yra didelė „slapto padažo“ dalis, todėl įvestis į „Google“ paiešką ir „Google“ padėjėją veikia gerai. „Google Cloud“ natūralios kalbos API ta pati technologija taikoma jūsų programoms. Jis gali atlikti sintaksės analizę (žr. Paveikslėlį žemiau), objektų išskyrimą, nuotaikų analizę ir turinio klasifikavimą 10 kalbų. Galite nurodyti kalbą, jei ją mokate; priešingu atveju API bandys automatiškai aptikti kalbą. Atskira API, kurią šiuo metu galima gauti iš anksto paprašius, specializuojasi su sveikatos priežiūra susijusiame turinyje.

Perskaitykite visą „Google Cloud Machine Learning“ API apžvalgą

Vertimas

„Google Cloud Translation“ API gali išversti daugiau nei šimtą kalbų porų, gali automatiškai aptikti šaltinio kalbą, jei jos nenurodote, ir yra trijų skonių: „Basic“, „Advanced“ ir „Media Translation“. „Advanced Translation“ API palaiko žodyną, paketinį vertimą ir pritaikytų modelių naudojimą. Pagrindinė vertimo API iš esmės yra ta, kurią naudoja vartotojo „Google Translate“ sąsaja. „AutoML Translation“ leidžia mokyti pasirinktinius modelius, naudojant mokymąsi perkėlimu.

„Media Translation“ API verčia turinį tiesiai iš garso (kalbos), garso failų ar srautų, 12 kalbų ir automatiškai sukuria skyrybos ženklus. Yra atskiri vaizdo ir telefono skambučių garso modeliai.

Perskaitykite visą „Google Cloud Machine Learning“ API apžvalgą