Programavimas

Watson wannabes: 4 atvirojo kodo projektai, skirti mašinų intelektui

Per pastaruosius metus, kaip dalį naujų įmonių paslaugų, kurias IBM stengėsi atnaujinti, Watsonas tapo mažiau „Jeopardy“ laimėjusiu triuku ir labiau įrankiu. Tai taip pat išlieka IBM nuosavybe.

Kokios yra galimybės sukurti natūralios kalbos mašininio mokymosi sistemą Watsono tvarka, nors ir su atvirojo kodo komponentais? Tam tikru laipsniu tai jau įvyko - iš dalies dėl to, kad pats „Watson“ buvo sukurtas kartu su esamais atvirojo kodo darbais, o kiti lygiagrečiai su Watsonu kūrė panašias sistemas. Čia apžvelgti keturi tokie projektai.

DARPA „DeepDive“

Didžiausias grupės prekės ženklas - DARPA „DeepDive“ projektas nėra skirtas mėgdžioti „Watson“ paprastos kalbos užklausų sistemą, bet Watsono sugebėjimas laikui bėgant pagerinti sprendimų priėmimą vadovaujant žmonėms.

Projektą, kurį daugiausia sukūrė Viskonsino universiteto profesorius Christopheris Re, yra atvirojo kodo („Apache 2.0“). Kaip rašo „EE Times“, pagrindinis „DeepDive“ tikslas yra sukurti automatizuotą nestruktūrizuotų duomenų klasifikavimo sistemą - vienu atveju pavyzdžiai suskirstyti straipsnius į techninius žurnalus. Planuojantys naudoti „DeepDive“ turėtų būti susipažinę su „SQL“ ir „Python“, tačiau sistema jau gali išgauti duomenis iš daugybės įprastų šaltinių, tokių kaip interneto puslapiai ar PDF dokumentai.

Apache UIMA

Nestruktūruotas informacijos valdymas (UIMA) yra tekstinio turinio analizės standartas. Watsonas naudojo UIMA diegimą, tačiau norint naudoti UIMA nereikia eiti per Watsoną. Tiesą sakant, IBM UIMA architektūra buvo atvirų šaltinių ir ją prižiūri „Apache Foundation“. Jame palaikomos kelios programavimo kalbos, o atnaujinimai periodiškai pridedami (paskutinį kartą 2014 m. Spalio mėn.).

Apache UIMA tokia, kokia ji yra, yra toli nuo pilno mašininio mokymosi sprendimo; tai tik viena - nors ir svarbi - IBM sukurtos visumos dalis. Jei nenorite naudoti plikų kaulų, galite pasiimti vieną iš jo išvestinių projektų, pavyzdžiui, „YodaQA“, kuris naudoja UIMA apdorojimui ir naudoja „Wikipedia“ kaip pagrindinį duomenų šaltinį.

„OpenCog“

„OpenCog“ siekia suteikti mokslininkams ir programinės įrangos kūrėjams bendrą platformą dirbtinio intelekto programoms kurti ir dalytis “. Atviras šaltinis pagal GNU „Affero“ licenciją, projekto tikslas yra ne mažiau kaip tai, ką jo kūrėjai vadina „paprastai inteligentiškomis“ sistemomis, dirbtiniu intelektu, kuris turi platų, žmogišką supratimą apie pasaulį, o ne į domeną orientuotas specialybes (pavyzdžiui, yra labai gerai šachmatais, bet nieko kito).

„OpenCog“ kūrėjai teigia, kad jų sistema jau naudojama „natūralių kalbų programose - tiek tyrimams, tiek komercinėms korporacijoms“. Tai padaro jį šiek tiek atokiau nuo dirbtinio intelekto dirbtinio intelekto koncepcijų ir arčiau praktinio klausimų ir atsakymų domeno, kuriame gyvena Watsonas.

OAQA (atviras atsakymas į klausimus atsakančias sistemas)

Kaip gali reikšti pavadinimas, OAQA misija yra „atvira pažanga kuriant atsakymo į klausimus sistemas - kalbos programinės įrangos sistemas, kurios teikia tiesioginius atsakymus į natūralios kalbos klausimus“. Skamba kaip vienas iš Watsono tikslų? Taip, ypač todėl, kad OAQA kartu inicijavo IBM ir Carnegie Mellon universitetas. Kaip ir „Apache UIMA“, „OAQA“ įgyvendina „UIMA“ sistemą, tačiau nemanykite, kad tai yra paruoštas naudoti sprendimas; tai priemonių rinkinys.

Vienas iš svarbiausių kiekvieno projekto trūkumų, kaip jūs galite atspėti, yra tai, kad jie nėra siūlomi beveik taip pat rafinuotoje ar nugludintoje pakuotėje kaip Watsonas. Nors „Watson“ sukurtas naudoti nedelsiant verslo kontekste, tai yra neapdoroti įrankių rinkiniai, kuriuos reikia sunkiai pakelti.

Be to, Watsono paslaugos jau buvo iš anksto apmokytos kuruojant tikrojo pasaulio duomenis. Naudodamiesi šiomis sistemomis, turėsite pateikti duomenų šaltinius, kurie gali pasirodyti esąs kur kas didesnis projektas nei pats programavimas.

$config[zx-auto] not found$config[zx-overlay] not found