Programavimas

Kodėl įmonės iš „TensorFlow“ pereina į „PyTorch“

Mašininio mokymosi, gilaus mokymosi pakategorėje naudojami daugiasluoksniai neuroniniai tinklai, kad būtų galima automatizuoti istoriškai sunkias mašinų užduotis - tokias kaip vaizdo atpažinimas, natūralios kalbos apdorojimas (NLP) ir mašininis vertimas.

2015 m. Iš „Google“ atsiradusi „TensorFlow“ buvo populiariausia atvirojo kodo giluminio mokymosi sistema tiek tyrimams, tiek verslui. Tačiau „PyTorch“, kuris 2016 m. Atsirado iš „Facebook“, greitai pasivijo dėka bendruomenės sukurtų patobulinimų, susijusių su naudojimo paprastumu ir diegimu, siekiant išplėsti naudojimo atvejų spektrą.

„PyTorch“ pastebi ypač stiprų pritaikymą automobilių pramonėje, kur jis gali būti pritaikytas bandomosioms autonominėms vairavimo sistemoms, panašioms į „Tesla“ ir „Lyft“ 5 lygius. Ši sistema taip pat naudojama turinio klasifikavimui ir rekomendacijoms žiniasklaidos įmonėse bei padėti palaikyti robotus. pramonėje.

Joe Spisakas, dirbtinio intelekto vadovas iš „Facebook AI“, sakė, kad nors jis džiaugiasi padidėjusiu „PyTorch“ pritaikymu įmonėje, vis dar reikia daug nuveikti, kad pramonė būtų plačiau pritaikyta.

„Kita priėmimo banga įgalins gyvavimo ciklo valdymą, MLOps ir„ Kubeflow “vamzdynus bei aplinkinę bendruomenę“, - sakė jis. „Kelionės pradžioje įrankiai yra gana geri, norint pradėti naudotis valdomomis paslaugomis ir keletu atvirojo kodo su„ SageMaker “AWS ar„ Azure ML “.

„Disney“: animacinių veidų atpažinimas filmuose

Nuo 2012 m. Žiniasklaidos milžinės „Disney“ inžinieriai ir duomenų mokslininkai kūrė tai, ką bendrovė vadina „Content Genome“ - žinių grafiką, kuris sujungia turinio metaduomenis į mašininio mokymosi pagrįstas paieškos ir suasmeninimo programas visoje masinėje „Disney“ turinio bibliotekoje.

„Šie metaduomenys tobulina įrankius, kuriuos„ Disney “pasakotojai naudoja kurdami turinį; įkvėpti kartotinį kūrybiškumą pasakojant; energijos vartojimo patirtis naudojant rekomendacijų variklius, skaitmeninę navigaciją ir turinio paieškas; ir įgalinti verslo intelektą “, - liepos mėn. tinklaraščio įraše rašė„ Disney “kūrėjai Miquel Àngel Farré, Anthony Accardo, Marc Junyent, Monica Alfaro ir Cesc Guitart.

Prieš tai įvykstant, „Disney“ turėjo investuoti į didžiulį turinio anotacijų projektą, kreipdamasis į savo duomenų mokslininkus mokyti automatizuoto žymėjimo vamzdyno, naudodamas gilius mokymosi modelius atvaizdų atpažinimui, kad būtų galima nustatyti didžiulius žmonių, personažų ir vietų vaizdų kiekius.

„Disney“ inžinieriai pradėjo eksperimentuodami su įvairiomis struktūromis, įskaitant „TensorFlow“, tačiau nusprendė konsoliduotis aplink „PyTorch“ 2019 m. objektų aptikimo architektūra dubliuoti regionai su konvoliuciniais neuroniniais tinklais (R-CNN). Pastarasis buvo palankesnis tvarkant tiesioginio veiksmo, animacijos ir vaizdo efektų derinius, paplitusius „Disney“ turinyje.

"Sunku apibrėžti, kas yra veidas animaciniame filme, todėl perėjome prie gilaus mokymosi metodų, naudodami objektų detektorių, ir panaudojome mokymąsi perkėlimu", - paaiškino "Disney Research" inžinierė Monica Alfaro. Apdorojus vos kelis tūkstančius veidų, naujasis modelis jau plačiai identifikuodavo veidus visais trim naudojimo atvejais. Jis pradėtas gaminti 2020 m. Sausio mėn.

„Dabar trijų tipų veidams naudojame tik vieną modelį, ir tai yra puiku norint dalyvauti„ Marvel “filme, kaip„ Keršytojai “, kur jis turi atpažinti ir„ Geležinį žmogų “, ir Tony Starką, arba bet kurį personažą, dėvintį kaukę“, - sakė ji.

Kadangi inžinieriai susiduria su tokia didele vaizdo duomenų apimtimi, kad galėtų mokyti ir paleisti modelį lygiagrečiai, jie, norėdami pereiti į gamybą, taip pat norėjo veikti brangiais, našiais GPU.

Perėjimas nuo procesorių leido inžinieriams greičiau treniruotis ir atnaujinti modelius. Tai taip pat pagreitino rezultatų paskirstymą įvairioms „Disney“ grupėms, sutrumpindamas apytiksliai valandą ilgo vaidybinio filmo rezultatą ir pasiekdamas rezultatų nuo 5 iki 10 minučių.

„TensorFlow objektų detektorius iškėlė atminties problemų gamyboje ir buvo sunkiai atnaujinamas, o„ PyTorch “turėjo tą patį objektų detektorių ir„ Faster-RCNN “, todėl viskam pradėjome naudoti„ PyTorch “, - pasakojo Alfaro.

Tas perėjimas iš vienos sistemos į kitą buvo stebėtinai paprastas ir inžinierių komandai. „Pakeisti [į„ PyTorch “] buvo lengva, nes visa tai yra įmontuota, jūs prijungiate tik kai kurias funkcijas ir galite pradėti greitai, taigi tai nėra kieta mokymosi kreivė“, - sakė Alfaro.

Kai jie susidūrė su problemomis ar kliūtimis, gyvybinga „PyTorch“ bendruomenė galėjo padėti.

„Blue River“ technologija: piktžoles naikinantys robotai

„Blue River Technology“ sukūrė robotą, kuris naudoja svaiginantį skaitmeninio kelio nustatymo, integruotų fotoaparatų ir kompiuterio matymo derinį, kad piktžoles puršktų herbicidu, o beveik realiu laiku paliktų pasėlius vienus, o tai padėtų ūkininkams efektyviau išsaugoti brangius ir aplinkai žalingus herbicidus.

Kalifornijoje įsikūrusi bendrovė „Sunnyvale“ atkreipė dėmesį į sunkiosios technikos gamintoją „John Deere“ 2017 m., Kai ji buvo įsigyta už 305 mln. USD, siekiant integruoti technologiją į savo žemės ūkio įrangą.

„Blue River“ tyrinėtojai eksperimentavo su įvairiais giluminio mokymosi pagrindais, bandydami mokyti kompiuterinio regėjimo modelių, kad atpažintų piktžolių ir pasėlių skirtumą. Tai yra didžiulis iššūkis, kai susiduriate su medvilniniais augalais, kurie labai apgailėtinai panašūs į piktžoles.

Buvo parengti aukštos kvalifikacijos agronomai, kurie atliks rankines vaizdų žymėjimo užduotis ir mokė konvoliucinį neuroninį tinklą (CNN), naudodami „PyTorch“, „analizuodami kiekvieną kadrą ir paruošdami taškų tikslumą pasėlių ir piktžolių žemėlapyje“, Chrisas Padwickas, kompiuterių direktorius vizija ir mašinų mokymasis „Blue River Technology“, rugpjūčio mėn.

„Kaip ir kitos įmonės, mes išbandėme„ Caffe “,„ TensorFlow “ir tada„ PyTorch “, - pasakojo Padwickas. „Mums tai veikia iš esmės. Mes apskritai neturėjome pranešimų apie klaidas ar blokuojančių klaidų. Skirstant skaičiavimą, jis tikrai šviečia ir yra lengviau naudojamas nei „TensorFlow“, kuris duomenų paralelizmui buvo gana sudėtingas “.

Padwickas teigia, kad „PyTorch“ sistemos populiarumas ir paprastumas suteikia jam pranašumų, kai reikia greitai įdarbinti naujus darbuotojus. Tai sakant, Padwickas svajoja apie pasaulį, kuriame „žmonės tobulėtų bet kur, kas jiems patinka. Kai kurie mėgsta „Apache MXNet“, „Darknet“ ar „Caffe“, tačiau gamyboje tai turi būti viena kalba, o „PyTorch“ turi viską, ko reikia sėkmei. “

Datarockas: Debesų vaizdų analizė kasybos pramonei

Geologų grupės įkurtas Australijos startuolis „Datarock“ kasybos pramonėje taiko kompiuterio regėjimo technologijas. Tiksliau, jos giluminio mokymosi modeliai padeda geologams greičiau nei anksčiau analizuoti pagrindinius pavyzdinius vaizdus.

Paprastai geologas, norėdamas įvertinti mineralogiją ir struktūrą, mėgindamasis mėginius perimdavo centimetrus po centimetrus, o inžinieriai ieškodavo tokių fizinių savybių kaip trūkumai, lūžiai ir uolienų kokybė. Šis procesas yra lėtas ir linkęs į žmogaus klaidas.

"Kompiuteris gali pamatyti uolas, kaip matytų inžinierius", - sakė Brentonas Crawfordas, Datarocko generalinis direktorius. „Jei matote paveikslėlyje, galime išmokyti modelį jį analizuoti taip pat kaip ir žmogų“.

Panašiai kaip „Blue River“, Datarockas gamyboje naudoja RCNN modelio variantą, o mokslininkai kreipiasi į duomenų didinimo būdus, kad ankstyvosiose stadijose surinktų pakankamai mokymo duomenų.

„Po pradinio atradimo laikotarpio komanda ėmėsi derinti metodus, kad būtų sukurta vaizdų apdorojimo darbo eiga, skirta gręžti pagrindinius vaizdus. Tai apėmė gilaus mokymosi modelių, kurie galėtų neapdorotus vaizdus apdoroti struktūriniu formatu ir suskirstyti svarbią geologinę informaciją, seriją “, - rašė mokslininkai tinklaraščio įraše.

Naudodamiesi „Datarock“ technologija, klientai gali pasiekti rezultatų per pusvalandį, o ne penkias ar šešias valandas, kurių reikia norint rankiniu būdu užregistruoti radinius. Tai atlaisvina geologus nuo sunkesnių darbo vietų, sakė Crawfordas. Tačiau „kai mes automatizuojame sunkesnius dalykus, mes gauname tam tikrą grįžtamąjį ryšį ir turime paaiškinti, kad jie yra šios sistemos dalis, kad mokytų modelius ir gautų tą grįžtamąjį ryšį“.

Kaip ir daugelis įmonių, mokančių giliai mokytis kompiuterio regėjimo modelių, „Datarock“ pradėjo nuo „TensorFlow“, tačiau netrukus perėjo prie „PyTorch“.

„Pradžioje mes naudojome„ TensorFlow “ir tai mus užklupo dėl paslaptingų priežasčių“, - sakė mašinų mokymosi vadovas Dataroke Duy Tinas Truongas. „Tuo metu buvo išleisti„ PyTorch “ir„ Detecton2 “ir puikiai atitiko mūsų poreikius, todėl atlikę keletą bandymų pastebėjome, kad lengviau derinti ir dirbti, taip pat užimta mažiau atminties, todėl mes konvertuojomės“, - sakė jis.

Datarockas taip pat pranešė, kad 4 kartus pagerėjo išvadų našumas nuo „TensorFlow“ iki „PyTorch“ ir „Detectron2“, kai modeliai buvo paleisti GPU ir 3 kartus - procesoriuose.

Kaip perėjimo priežastį Truongas nurodė augančią „PyTorch“ bendruomenę, gerai suprojektuotą sąsają, paprastą naudojimą ir geresnį derinimą ir pažymėjo, kad nors „sąsajos požiūriu jos visiškai skiriasi, tačiau, jei žinote„ TensorFlow “, ją perjungti yra gana lengva. , ypač jei žinote „Python“.