Programavimas

Tikroji istorija, kaip didelių duomenų analizė padėjo Obamai laimėti

Galbūt girdėjote, kaip statistikos vedlys Nate'as Silveris numatė kiekvienos valstijos rinkimų balsus 2012 m. Prezidento rinkimuose, parodydamas, kad neapdorotų duomenų rinkimas yra daug patikimesnis nei tradicinis ekspertas. Ko jūs tikriausiai negirdėjote, yra tai, kaip Obamos kampanija sudarė 100 pajėgumų turinčius analitikus, kad būtų atlikta dešimčių terabaitų duomenų analizė naudojant „HP Vertica MPP“ (masiškai lygiagrečiai apdorojamas) analitinę duomenų bazę ir nuspėjamuosius modelius su „R“ ir „Stata“ įgyti konkurencinį pranašumą.

Didžiųjų duomenų metodo nuopelnas priklauso Obamos kampanijos vadovui Jimui Messinai, kuris nusprendė stačia galva pasinerti į analitikų valdomą kampaniją. Mesina pakomentavo: „Reikalavome duomenų apie viską, viską matavome ... ketinome į savo vidų įtraukti analitikų komandą, kuri visą laiką mus tyrė, kad įsitikintume, jog mes protingi dėl dalykų“. Kad viskas būtų išmatuota, darbuotojai buvo įvertinti, ar jie įvedė duomenis. Mantra tapo: „Jei neįvedėte duomenų, neatlikote darbo“.

[Atsisiųskite „Big Data Analytics“ gilųjį nardymą, kad gautumėte išsamią ir praktišką šio klestinčio lauko apžvalgą. | Pasinaudokite „Hadoop“ galia naudodamiesi 7 geriausiais įrankiais, kad prisijaukintumėte didelius duomenis. ]

Batai ant žemės

Iš 100 analitikų darbuotojų 50 dirbo tam skirtame analitikos skyriuje, 20 analitikų buvo pasklidę po įvairias kampanijos būstines, dar 30 dirbo lauke, aiškindami duomenis.

Nacionalinio demokratų komiteto duomenų architektūros direktorius Chrisas Wegrzynas aprašė iššūkius, galimybes ir kelią kurti analitika pagrįstą kampaniją. Wegrzyn pažymėjo, kad pagrindiniai matavimai buvo sutelkti į pačius duomenis, modeliavimą ir eksperimentus. Pagrindiniuose duomenyse buvo faktai apie rinkėjus ir kampanijos operaciją. Modeliavimas buvo naudojamas norint suprasti rinkėjus atskirų rinkėjų lygiu. Galiausiai, įvertinus eksperimentų rezultatus, kampanija padėjo sužinoti, kaip jos veiksmai iš tikrųjų paveikė žmones.

Žinoma, pagrindinis kampanijos veiklos rodiklis buvo skaičius, planavusių balsuoti už Obamą, padalytas iš tų, kurie planavo balsuoti iš viso. Kampanija suprato, kad norint padidinti šį skaičių yra trys svertai: registracija, įtikinėjimas ir aktyvumas. Jie turėjo skatinti savo tikslinę rinkėjų auditoriją registruotis, įtikinti neapsisprendusius balsuoti už Obamą, tada padaryti viską, kad Obamos rinkėjai pasirodytų balsuoti rinkimų dieną.

Kariuomenės maršalas

Anksčiau visi šie skyriai naudojo sudėtingas analitines technologijas, tačiau individualius analitinius metodus įgyvendino savarankiškai. 2012 metų kampanija visa tai pakeitė.

Tinkami žmonės ir įgaliojimai buvo svarbūs, kad vieninga analitinė aplinka taptų realybe. Būtina buvo vadovų įpirkimas iš kampanijos vadovės Messinos; be šios valdžios bet kokia ambicinga iniciatyva galėjo būti aplenkta arba apskritai atsisakyta. Be to, pagrindinė komanda turėjo didelę analitinę patirtį iš ankstesnių kampanijų - ir labai talentingi analitiniai darbuotojai buvo pasamdyti gerokai žemiau rinkos normos.

Copyright lt.verticalshadows.com 2024

$config[zx-auto] not found$config[zx-overlay] not found