Vandens kankinimas - „Analytics“ analogija yra per toli

lašelinė analizė

Duomenys, kaip ir vanduo, būna įvairūs. Žmogaus protas išsivystė taip, kad išfiltruotų didžiąją dalį mūsų keliamų duomenų, nes jų paprasčiausiai yra labai daug.

Atidarius akis ir ausis, duomenų yra visur. Sienos spalva, oro kondicionieriaus garsas ir kaimyno kavos kvapas yra traktuojami kaip drėgmė. Vanduo visą laiką yra ore, tačiau daug dėmesio jam skirti nėra naudinga.

Kai vanduo kondensuojasi į rūką, jis priverčia jį pamatyti ir dar labiau apsunkina supratimą apie aplinkinį pasaulį. Neužbaigti duomenų rinkiniai, sugadinti duomenys, blogas mokslas, klaidingos išvados ir pažintinis šališkumas priverčia jus paklysti migloje.

Duomenys krinta kaip lietus. Kai yra tik nedaug, tai yra nepaprastai nepatenkinta - tiek pakanka, kad automobilis būtų purvinas ir suklaidintų pokalbį. Jūs pastebite, kad nuvalote akinių vietą, kai kas nors išpjauna kokį nors atsitiktinį duomenų tašką, surinktą iš kokio nors neaiškaus šaltinio.

  • Pasenęs vanduo negiliame tvenkinyje yra pavojinga. Duomenys, surinkti iš nepatikimo tiekimo, nei išvalyti, nei normalizuoti ir palikti stagnuoti, gali lengvai padaryti klaidingas išvadas.
  • A pastovus srautas vandens gali užtekti užpildyti valgyklą ar palaikyti miško ekosistemą. Vos trys duomenų taškai (išsiųstų el. Laiškų skaičius, palyginti su atidarytais, palyginti su paspaudimais) gali palaikyti rinkodaros programą.
  • A sveikesnis srautas mažo upelio pavidalo duomenų galima naudoti maudynėms. Nuolatinis duomenų srautas leidžia palyginti ir palyginti istorinius duomenis. Nukreipimo puslapio optimizavimą galima atlikti naudojant pastovius konversijų duomenis.
    A kukli upė gali varyti malūną medienai pjauti ar kviečiams malti. Norint padidinti pirkinių krepšelių vertę, rekomendaciniam varikliui reikia tik kelių intakų patikimo indėlio.
  • A krioklys gali varyti didžiulį vandens ratą ir pakankamas informacijos srautas gali paskatinti dinamišką turinio sistemą realiuoju laiku.
  • A upė tai pakankamai platus ir gilus, gali padėti visai transporto pramonei. Pakankamai duomenų gali plukdyti baržos ir krovininiai laivai, turintys slapukų rinkinį iš reklamos tinklų, lojalumo kortelių programos duomenų kaupėjų ir duomenų brokerių.

Kai numatytu laiku gaunama tikėtina duomenų suma, juos galima užfiksuoti, nukreipti ir naudoti. Drėkinimo sistemos, užtvankos ir rezervuarai suteikia valdymo jausmą ir leidžia statyti vis platesnę infrastruktūrą su kanalais, spynomis ir užtvankomis. Duomenų sandėliai buvo pastatyti ant mažiau patikimų srautų.

Švara yra šalia dievobaimingumo

Švarus vanduo yra gyvybiškai svarbus gyvenimo, drėkinimo, elektrinių eksploatavimo ir kt. Sėkmei. „Švaraus“ apibrėžimas šiuo tikslu gali pasikeisti; viskas gerai, jei vandenyje yra dumblių, kurie aušina elektrinę, ir tai nėra priimtina, jei geriamajame vandenyje yra daugiau nei 10 milijardų arseno dalių.

Duomenys yra tokie patys. Tiesioginio pašto programoje nesvarbu, ar turite asmens vardą (p., Ponia, ponia) ... nebent jūs siunčiate laišką gydytojams. Bet nešvarūs duomenys kiekvieną kartą pakels jus.

Kaip JAV vyriausiasis duomenų mokslininkas, DJ Patil, pateikite tai pirmajame CTO aukščiausiojo lygio susitikime: „Jei nuo pat pradžių negalvojate, kaip išlaikyti savo duomenis švarius, esate f ^ ¢ ir red. Aš tai garantuoju. Bandymas išvalyti po to užtruks mažiausiai mėnesius “.

Jei kaitinsite vandenį iki virimo temperatūros, jis gali sukelti visą pramonės revoliuciją. Panašu, kad duomenys daro tą patį. Nuo to momento, kai kompiuteriai galėjo saugoti ir skaičiuoti, duomenys buvo renkami taip greitai, kaip būtų galima sukurti saugojimo įrangą.

Duomenų ežeras

Šių intakų duomenys sklinda per malūnų variklius, visa tai patenka į ežerą, už užtvankos. Duomenys išleidžiami kontroliuojant, jie valdo duomenų pramonės turbinas; tie milžiniški duomenų apdorojimo varikliai su tokiais pavadinimais kaip „Google“ ir „Facebook“. Čia nebus sausros.

Ir galiausiai yra gilus vandens telkinys, laukiantis, kol analitikas ners. Nardymo įrankiai ir ieties ginklas rankose, analitikas tiria gilumą, žemėlapiuoja naują dirvą ir atranda naujų rūšių. Tai labai įdomus laikas būti duomenų tyrinėtoju.

Štai kodėl tiek daug jų pasirodė „eMetrics“ aukščiausiojo lygio susitikimas nuo 2002 m. Kita galimybė yra Bostone, 27 m. rugsėjo 1–2015 d.

„eMetrics Summit“ registracija

Bridge Too Far

O kokia duomenų galia iškirpti kitą Didįjį kanjoną? Ką apie ledyninį struktūrinių duomenų tirpimą? Kaip mes tvarkome nuotekas pasaulyje, kuris vis labiau suvokia privatumą?

Tai klausimai kitam laikui ir vanduo po tiltu.

Ką manote?

Ši svetainė naudoja "Akismet", kad sumažintų šlamštą. Sužinokite, kaip apdorojamas jūsų komentaras.