Programavimas

Peržiūra: „Google Cloud AutoML“ yra tikrai automatizuotas mokymasis mašinomis

Kai bandote automatiškai išmokyti geriausią mašininio mokymosi modelį savo duomenims, yra „AutoML“ arba automatizuotas mašininis mokymasis, tada yra „Google Cloud AutoML“. „Google Cloud AutoML“ yra viršuje pateiktas pjūvis.

Anksčiau aš apžvelgiau „H2O AI“ be tvarkyklių, „Amazon SageMaker“ ir „Azure Machine Learning AutoML“. AI be vairuotojo automatiškai atlieka funkcijų inžineriją ir hiperparametrų derinimą ir teigia, kad taip pat gerai veikia kaip ir „Kaggle“ meistrai. „Amazon SageMaker“ palaiko hiperparametrų optimizavimą. „Azure Machine Learning AutoML“ automatiškai peržiūri pagrindinių mašininio mokymosi algoritmų funkcijas, algoritmus ir hiperparametrus; atskira „Azure Machine Learning“ hiperparametrų derinimo priemonė suteikia galimybę nušluoti esamų eksperimentų specifinius hiperparametrus.

Tai yra gerai, tačiau „Google Cloud AutoML“ eina į visiškai kitą lygį ir pritaiko jūsų „Google“ mūšyje patikrintus, labai tikslius giliųjų neuronų tinklus jūsų pažymėtiems duomenims. Užuot pradėjęs nuo nulio mokydamas modelius iš savo duomenų, „Google Cloud AutoML“ įgyvendina automatinį giluminio perkėlimo mokymą (tai reiškia, kad jis pradedamas nuo esamo gilaus neuroninio tinklo, apmokyto pagal kitus duomenis) ir neuroninės architektūros paiešką (tai reiškia, kad randa tinkamą derinį tinklo sluoksniai) kalbų porų vertimui, natūralių kalbų klasifikavimui ir vaizdų klasifikavimui.

Kiekvienoje srityje „Google“ jau turi vieną ar kelias iš anksto apmokytas paslaugas, pagrįstas giliais neuroniniais tinklais ir didžiuliais etikečių duomenų rinkiniais. Tai gali būti naudinga nepakeistiems jūsų duomenims, todėl turėtumėte tai išbandyti, kad sutaupytumėte laiko ir pinigų. Jei šios paslaugos neatlieka to, ko jums reikia, „Google Cloud AutoML“ padeda jums sukurti tokį modelį, nereikalaujant, kad jūs žinotumėte, kaip atlikti perkėlimo mokymą ar net kaip sukurti neuroninius tinklus.

Mokymasis perkelti siūlo du didelius privalumus, lyginant su neuroninio tinklo mokymu nuo nulio. Pirma, mokymui reikia daug mažiau duomenų, nes dauguma tinklo sluoksnių jau yra gerai apmokyti. Antra, jis veikia daug greičiau, nes optimizuoja tik paskutinius sluoksnius.

„Google Cloud“ automatinis vertimas

Pavyzdžiui, per valandą ar dvi galite mokytis prieš 1000 dviejų kalbų porų porų per „Google Cloud AutoML Translation“ mokymąsi. Pagrindiniam pritaikomam neuroniniam tinklui, NMT, prireikė šimtų iki tūkstančių valandų, kad kiekviena kalbų pora mokytųsi nuo nulio daugybėje centrinių procesorių ir GPU. Atminkite, kad valandinis mokestis už individualaus vertimo modelio mokymą šiuo metu yra 76 USD.

„AutoML“ vertimo pradedančiųjų vadove paaiškinami pagrindai, ką gali atlikti „Google Cloud“ automatinis vertimas ir kodėl jūs jį naudosite. Iš esmės, jis patikslina esamą bendrą vertimo modelį nišiniam tikslui. Jums nereikia atlikti jokių mokymų generolas maždaug šimto kalbų, kurias „Google“ jau palaiko, vertimas, tačiau jums reikės paleisti perkėlimo mokymąsi, jei norite sukurti vertimo tinklą specializuota žodyną ar vartojimą. Vienas „Google“ paminėtų pavyzdžių yra laiko atžvilgiu svarbių finansinių dokumentų vertimas realiuoju laiku. Bendrosios paskirties vertime finansams ne visada bus naudojami teisingi meno terminai.

„Google Cloud AutoML Translation“ mokymo nustatymas yra penkių žingsnių procesas, kaip parodyta toliau pateiktose ekrano kopijose, kai tik paruošiate failą su sakinių poromis. Aš naudoju 8720 anglų-ispanų porų „Google“ pateiktoms programų raginimams „AutoML Translation Quickstart“, suformatuotame kaip skirtukų skirtukų reikšmių failas. „Google Cloud AutoML Translation“ taip pat palaiko XML pagrįstą vertimo atminties eXchange (TMX) formatą sakinių poroms.

Atkreipkite dėmesį, kad nėra galimybės valdyti aparatinę įrangą (procesorius, GPU, TPU ir atmintį), naudojamą mokymui atlikti. Tai apgalvota: mokymuose bus naudojama tai, ko reikia. Taip pat nėra galimybių kontroliuoti prie modelio pridedamus neuroninio tinklo sluoksnius, paleistinų epochų skaičių ar stabdymo kriterijus.

Baigę modelio mokymą, galite peržiūrėti BLEU balo pagerėjimą (jei viskas gerai), palyginti su pagrindiniu modeliu, ir pabandyti numatyti modelį. Šis mokymas užtruko 0,9 valandos (mažiau nei prognozuota) ir kainavo 68,34 USD.

„Google Cloud AutoML“ natūrali kalba

„Google Natural Language“ API ima tekstą ir numato objektus, nuotaikas, sintaksę ir kategorijas (iš anksto nustatyto sąrašo). Jei jūsų teksto klasifikavimo problema netinka nė vienai iš jų, galite pateikti paženklintą sakinių rinkinį ir naudoti „Google Cloud AutoML Natural Language“, kad sukurtumėte pasirinktinį klasifikatorių.

Norėdami nustatyti „AutoML Natural Language“ mokymams, turite surinkti duomenis, juos pažymėti, paruošti kaip CSV failą ir vykdyti mokymą. Taip pat galite naudoti „AutoML Natural Language“ vartotojo sąsają duomenims įkelti ir pažymėti, jei norite.

Užbaigus modelio mokymą, galite peržiūrėti modelio tikslumo, atšaukimo ir painiavos matricą. Taip pat galite pakoreguoti balų slenkstį norimam tikslumui / atšaukimui. Kad sumažintumėte klaidingus neigiamus parametrus, optimizuokite juos atšaukti. Norėdami sumažinti klaidingą teigiamą informaciją, optimizuokite tikslumą.

Šis mokymas užtruko 3,63 valandos (maždaug taip, kaip buvo prognozuota) ir kainavo 10,88 USD.

„Google Cloud AutoML Vision“

„Google Cloud Vision“ API klasifikuoja vaizdus tūkstančiuose iš anksto nustatytų kategorijų, aptinka atskirus vaizduose esančius objektus ir veidus, randa ir skaito vaizduose esančius spausdintus žodžius. „Google Cloud AutoML Vision“ leidžia apibrėžti ir apmokyti savo kategorijų sąrašą. Kai kurios realios programos apima vėjo jėgainių pažeidimų nustatymą iš bepiločių orlaivių nuotraukų ir atliekų tvarkymo klasifikavimą.

Norėdami nustatyti „Google Cloud AutoML Vision“ duomenų rinkinį, turite surinkti mažiausiai 100 kiekvienos kategorijos vaizdų ir pažymėti juos CSV faile. Visi vaizdai ir CSV failas turi būti „Google Cloud Storage“ grupėje.

Aš nustatiau, kad ši treniruotė būtų vykdoma ne ilgiau kaip valandą, o tai nemokama iki 10 modelių per mėnesį. Buvau maloniai nustebinta, kai pamačiau gerus nemokamų treniruočių rezultatus, ir nesivarginau tęsti treniruotes, kad pagerintumėte tikslumą ir prisiminimus.

„Google Cloud AutoML“ suteikia patogias parinktis tiksliniams vertimams atlikti, tinkintam teksto klasifikavimui ir pritaikytam vaizdų klasifikavimui. Kiekviena iš šių API veikia gerai, jei joms suteikiate pakankamai tiksliai pažymėtų duomenų ir užima daug mažiau laiko ir įgūdžių nei kuriant savo neuroninio tinklo modelį ar net savo perkėlimo mokymosi modelį. Naudodami „Google Cloud AutoML“, jūs iš tikrųjų kuriate „TensorFlow“ modelius, nebūtinai nieko nežinodami apie „TensorFlow“, „Python“, neuroninio tinklo architektūras ar mokymo aparatūrą.

Yra daugybė būdų, kaip neteisingai paruošti duomenis, tačiau, laimei, visos trys API tikrina dažniausiai pasitaikančias klaidas, pavyzdžiui, turi per mažai arba per daug bet kurios kategorijos pavyzdžių. Po treniruotės rodoma diagnostika leidžia gerai suprasti, kaip gerai veikia jūsų modelis, ir jūs galite lengvai patobulinti modelius, pridėdami daugiau pažymėtų treniruočių duomenų ir iš naujo vykdydami mokymą.

Kaina: „Google Cloud AutoML“ vertimas: mokymas kainuoja 76,00 USD per valandą, vertimas - 80 USD už milijoną simbolių po pirmųjų 500 K. „Google Cloud AutoML Natural Language“: mokymai kainuoja 3,00 USD per valandą, klasifikacija - 5 USD už tūkstantį teksto įrašų po pirmųjų 30 000 įrašų. „Google Cloud AutoML Vision“: mokymai po pirmos valandos kainuoja 20 USD per valandą, o po pirmojo tūkstančio klasifikavimas - 3 USD už tūkstantį vaizdų.

Platforma: „Google Cloud Platform“