Programavimas

Šiandien duomenų mokslo vaidmenų nebus po 10 metų

Ateinantį dešimtmetį duomenų žinovo vaidmuo, kaip žinome, atrodys visai kitoks nei šiandien. Bet nesijaudinkite, prarastų darbų niekas neprognozuoja, tiesiog pasikeitė darbo vietų.

Duomenų mokslininkams viskas bus gerai - anot Darbo statistikos biuro, prognozuojama, kad iki 2029 m. Vaidmuo augs didesniame nei vidutinis klipe. Tačiau technologijų pažanga bus postūmis didžiuliam duomenų mokslininko atsakomybės ir atsakomybės pokyčiui. tai, kaip verslas priartėja prie analizės visumos. „AutoML“ įrankiai, padedantys automatizuoti mašininio mokymosi procesą nuo pradinių duomenų iki tinkamo naudoti modelio, paskatins šią revoliuciją.

Po 10 metų duomenų mokslininkai turės visiškai skirtingus įgūdžių ir įrankių rinkinius, tačiau jų funkcija išliks ta pati: tarnauti kaip pasitikintys ir kompetentingi technologijų vadovai, kurie gali suprasti sudėtingus duomenis verslo problemoms spręsti.

„AutoML“ demokratizuoja duomenų mokslą

Dar neseniai mašininio mokymosi algoritmai ir procesai buvo beveik išimtinai tradicinių duomenų mokslo vaidmenų - turinčių oficialų išsilavinimą ir aukštesnį išsilavinimą arba dirbantys didelėse technologijų korporacijose - sritis. Duomenų mokslininkai atliko neįkainojamą vaidmenį kiekvienoje mašininio mokymosi raidos spektro dalyje. Tačiau laikui bėgant jų vaidmuo taps labiau bendradarbiaujantis ir strateginis. Naudodami tokias priemones kaip „AutoML“, kad automatizuotų kai kuriuos jų akademinius įgūdžius, duomenų mokslininkai gali sutelkti dėmesį į tai, kaip organizacijoms rasti verslo problemų sprendimą naudojantis duomenimis.

Daugeliu atvejų taip yra todėl, kad „AutoML“ demokratizuoja pastangas pritaikyti mašininį mokymąsi praktiškai. Pardavėjai nuo pradedančiųjų iki debesų hiperkalerijų išleido sprendimus, kuriuos kūrėjai gali pakankamai lengvai naudoti ir eksperimentuoti be didelių švietimo ar patirties kliūčių patekti į rinką. Panašiai kai kurios „AutoML“ programos yra pakankamai intuityvios ir paprastos, kad netechniniai darbuotojai galėtų išbandyti savo jėgas kurdami problemų sprendimus savo departamentuose - organizacijose sukurdami tam tikrą „piliečių duomenų mokslininką“.

Kad galėtume ištirti galimybes, kurias gali suteikti šios rūšies įrankiai tiek kūrėjams, tiek duomenų mokslininkams, pirmiausia turime suprasti dabartinę duomenų mokslo būklę, susijusią su mašininio mokymosi plėtra. Lengviausia suprasti, kai skirstoma į brandos skalę.

Mažesnės organizacijos ir įmonės, atliekančios tradicinius vaidmenis, atsakingos už skaitmeninę transformaciją (t. Y. ne klasikinio išsilavinimo duomenų mokslininkai) paprastai patenka į šią skalės pabaigą. Šiuo metu jie yra didžiausi automatinio mokymosi programų klientai, labiau orientuoti į auditoriją, kuri nėra susipažinusi su mašininio mokymosi subtilybėmis.

  • Argumentai už: Šias „iki rakto“ programas paprastai lengva įdiegti, palyginti pigiai ir lengvai įdiegti. Mažesnėms įmonėms, kuriose vykdomas labai specifinis automatizavimo ar tobulinimo procesas, rinkoje gali būti keletas perspektyvių variantų. Dėl žemos patekimo į rinką kliūčių šios programos puikiai tinka duomenų mokslininkams, kurie pirmą kartą pradeda mokytis mašinų. Kadangi kai kurios programos yra tokios intuityvios, jos net netechniniams darbuotojams suteikia galimybę eksperimentuoti su automatizavimu ir pažangiomis duomenų galimybėmis - potencialiai į organizaciją įvedant vertingą smėlio dėžę.
  • Minusai: Ši mašininio mokymosi programų klasė yra žinoma nelanksti. Nors juos galima lengvai įgyvendinti, jie nėra lengvai pritaikomi. Tam tikrų tikslumo lygių tam tikrose programose gali būti neįmanoma. Be to, šias programas gali labai apriboti jų pasikliavimas iš anksto paruoštais modeliais ir duomenimis. 

Šių programų pavyzdžiai yra „Amazon Comprehend“, „Amazon Lex“ ir „Amazon Forecast“ iš „Amazon Web Services“ ir „Azure Speech Services“ bei „Azure“ kalbos supratimas (LUIS) iš „Microsoft Azure“. Šių įrankių dažnai pakanka, kad besiformuojantys duomenų mokslininkai galėtų žengti pirmuosius mašininio mokymosi žingsnius ir įvesti savo organizacijas toliau brandos spektro ribose.

Pritaikomi sprendimai naudojant „AutoML“

Organizacijoms, turinčioms didelius, tačiau gana įprastus duomenų rinkinius - manau, kad klientų operacijų duomenys ar rinkodaros el. Pašto metrika - reikia daugiau lankstumo, kai mašininis mokymasis sprendžiamas problemoms spręsti. Įveskite „AutoML“. „AutoML“ atlieka rankinio mašininio mokymosi darbo eigą (duomenų atradimas, tiriamoji duomenų analizė, hiperparametrų derinimas ir kt.) Ir sutraukia juos į konfigūruojamą šūsnį.

  • Argumentai už: AutoML programos leidžia atlikti daugiau eksperimentų su duomenimis didesnėje erdvėje. Tačiau tikroji „AutoML“ supervalstybė yra prieinamumas - galima sukurti nestandartines konfigūracijas ir palyginti lengvai patobulinti įvestis. Negana to, „AutoML“ nėra sukurta tik duomenų mokslininkams kaip auditorijai. Kūrėjai taip pat gali lengvai pasinerti į smėlio dėžę, kad į savo produktus ar projektus įtrauktų mašininio mokymosi elementus.
  • Minusai: Nors tai artėja, „AutoML“ apribojimai reiškia, kad rezultatų tikslumą bus sunku tobulinti. Dėl to laipsnius išlaikantys korteles nešantys duomenys mokslininkai dažnai žvelgia į programas, sukurtas naudojant „AutoML“, net jei rezultatas yra pakankamai tikslus, kad išspręstų esamą problemą.

Šių programų pavyzdžiai yra „Amazon SageMaker AutoPilot“ arba „Google Cloud AutoML“. Duomenų mokslininkams po dešimtmečio neabejotinai reikės žinoti tokias priemones kaip šie. Kaip ir kūrėjui, kuris moka kelias programavimo kalbas, duomenų mokslininkams reikės mokėti naudotis keliomis „AutoML“ aplinkomis, kad jie būtų laikomi geriausiais talentais.

„Rankomis valcuoti“ ir savaime sukurti mašininio mokymosi sprendimai 

Šiuo metu kuriama dauguma pažangių ir patentuotų mašininio mokymosi programų įmonėse ir „Fortune 500“. Šių organizacijų duomenų mokslininkai yra didelių komandų dalis, tobulinančios mašininio mokymosi algoritmus, naudojant istorinių įmonės duomenų krūvą, ir kuriančios šias programas nuo pat pradžių. Tokios pritaikytos programos yra įmanomos tik turint didelius išteklius ir talentą, todėl atsipirkimas ir rizika yra tokia didelė.

  • Argumentai už: Kaip ir bet kuri programa, sukurta nuo nulio, pritaikytas mašininis mokymasis yra „pažangiausias“ ir sukurtas remiantis giliu problemos supratimu. Tai taip pat tikslesnė - jei tik nedidelėmis paraštėmis - nei „AutoML“ ir „automatiniai“ mokymosi sprendimai.
  • Minusai: Pasirinktinę mašininio mokymosi programą pasiekti tam tikras tikslumo ribas gali būti labai sunku ir dažnai duomenų mokslininkų komandos reikalauja sunkiai pakelti. Be to, pritaikytos mašininio mokymosi galimybės yra daugiausiai laiko reikalaujančios ir brangiausiai sukuriamos.

Ranka valdomo mašininio mokymosi sprendimo pavyzdys yra tuščias „Jupyter“ bloknotas, duomenų importavimas rankiniu būdu ir kiekvieno žingsnio atlikimas nuo tiriamosios duomenų analizės iki modelio derinimo rankiniu būdu. Tai dažnai pasiekiama rašant pasirinktinį kodą naudojant atvirojo kodo mašininio mokymosi sistemas, tokias kaip „Scikit-learn“, „TensorFlow“, „PyTorch“ ir daugelis kitų. Šis metodas reikalauja didelės patirties ir intuicijos, tačiau gali duoti rezultatų, kurie dažnai lenkia mašininio mokymo paslaugas iki raktų ir „AutoML“.

Tokie įrankiai kaip „AutoML“ per artimiausius 10 metų pakeis duomenų mokslo vaidmenis ir atsakomybę. „AutoML“ naikina mašininio mokymosi naštą nuo nulio nuo duomenų mokslininkų, o mašininio mokymosi technologijos galimybes tiesiogiai perduoda kitų problemų sprendėjų rankoms. Laisvalaikiui sutelkus dėmesį į tai, ką jie žino - duomenims ir patiems įnašams, - duomenų mokslininkai po dešimtmečio bus dar vertingesni vadovai savo organizacijoms.

Ericas Milleris eina vyresniojo techninės strategijos direktoriaus pareigas „Rackspace“, kur teikia strateginių konsultacijų lyderystę su patikrintais „Amazon Partner Network“ (APN) ekosistemos kūrimo rezultatais.Ericas, atlikęs 20 metų įrodytą sėkmę įmonės IT srityje, vadovavo kelioms AWS ir sprendimų architektūros iniciatyvoms, įskaitant „AWS Well Architected Framework“ (WAF) vertinimo partnerių programą, „Amazon EC2“, skirtą „Windows Server AWS“ paslaugų teikimo programai, ir platų asortimentą. AWS perrašo keliolika milijardų dolerių vertės organizacijoms.

Naujųjų technologijų forumas suteikia galimybę tyrinėti ir aptarti besiformuojančios įmonės technologijas beprecedentiame gylyje. Atranka yra subjektyvi, atsižvelgiant į mūsų pasirinktas technologijas, kurios, mūsų manymu, yra svarbios ir labiausiai domina skaitytojus. nepriima rinkodaros užtikrinimo priemonės paskelbimui ir pasilieka teisę redaguoti visą pateiktą turinį. Visus klausimus siųskite adresu [email protected].

$config[zx-auto] not found$config[zx-overlay] not found