Programavimas

„Apache PredictionIO“: lengvesnis mašininis mokymasis naudojant „Spark“

„Apache“ fondas įtraukė naują mašininio mokymosi projektą į sąrašą „Apache PredictionIO“, atviro šaltinio projekto versiją, kurią iš pradžių sukūrė „Salesforce“ dukterinė įmonė.

Ką „PredictionIO“ daro mašininiam mokymuisi ir „Spark“

„Apache PredictionIO“ yra sukurtas „Spark“ ir „Hadoop“ viršuje ir aptarnauja „Spark“ pagrįstas prognozes iš duomenų, naudodamas pritaikomus šablonus bendroms užduotims atlikti. Programos siunčia duomenis į „PredictionIO“ įvykių serverį, kad išmokytų modelį, tada varikliui teiraujamasi prognozių pagal modelį.

„Spark“, „MLlib“, „HBase“, „Spray“ ir „Elasticsearch“ yra komplektuojamos su „PredictionIO“, o „Apache“ siūlo palaikomus SDK darbui „Java“, PHP, „Python“ ir „Ruby“. Duomenys gali būti saugomi įvairiuose galuose: „JDBC“, „Elasticsearch“, „HBase“, HDFS ir jų vietinės failų sistemos palaikomos ne dėžutėje. Užpakaliniai galai yra prijungiami, todėl kūrėjas gali sukurti pasirinktinę vidinę jungtį.

Kaip „PredictionIO“ šablonais lengviau teikti prognozes iš „Spark“

Ryškiausias „PredictionIO“ pranašumas yra šablonų sistema, skirta kurti mašininio mokymosi variklius. Šablonai sumažina sunkų kėlimą, kurio reikia norint sukurti sistemą tam, kad būtų teikiamos konkrečios prognozės. Jie apibūdina bet kokias trečiųjų šalių priklausomybes, kurių gali prireikti šiam darbui, pvz., „Apache Mahout“ mašininio mokymosi programos sistemą.

Kai kurie esami šablonai apima:

  • Universalus rekomendacinis variklis.
  • Teksto klasifikacija.
  • Išgyvenimo analizė (prognozuojant laiką tarp nesėkmių).
  • Temų žymėjimas naudojant Vikipediją kaip žinių bazę.
  • Panašumo analizė.

Kai kurie šablonai taip pat integruojami su kitais mašininio mokymosi produktais. Pvz., Dviejuose prognozavimo šablonuose, kurie šiuo metu yra „PredictionIO“ galerijoje, norėdami aptikti purvo greitį ir pateikti bendras rekomendacijas, naudokite „H2O.ai“ putojančio vandens priedus „Spark“.

„PredictionIO“ taip pat gali automatiškai įvertinti prognozavimo variklį, kad nustatytų geriausius su juo naudojamus hiperparametrus. Kūrėjas turi pasirinkti ir nustatyti metriką, kaip tai padaryti, tačiau paprastai reikia mažiau darbo, nei atliekant hiperparametrų nustatymą rankomis.

Vykdydamas paslaugą, „PredictionIO“ gali priimti prognozes atskirai arba kaip paketą. Paketinės prognozės automatiškai lygiagrečios „Spark“ klasteriui, jei visi paketinio numatymo užduotyje naudojami algoritmai gali būti nuoseklūs. (Numatytieji „PredictionIO“ algoritmai yra.)

Kur atsisiųsti „PredictionIO“

„PredictionIO“ šaltinio kodą galite rasti „GitHub“. Patogumui galima įsigyti įvairių „Docker“ vaizdų, taip pat „Heroku“ paketo paketą.

$config[zx-auto] not found$config[zx-overlay] not found