Kas tieši ir "lielie dati"?

Un kāpēc tas ir liels darījums?

"Lielie dati" ir jaunā zinātne par izpratni un cilvēku uzvedības prognozēšanu, pētot lielu apjomu nestrukturēto datu. Lielie dati tiek dēvēti arī kā "prognožu analīze".

Analizējot čivināt ziņas, Facebook plūsmas, eBay meklēšanas, GPS sekošanas un ATM mašīnas ir daži lieli datu piemēri. Citas formas ir drošības videoklipu, satiksmes datu, laika apstākļu, ierašanās lidojumu, mobilo tālruņu torņu žurnālu un sirdsdarbības trajektoriju studēšana. Lielie dati ir neskaidra jauna zinātne, kas mainās katru nedēļu, un tikai daži eksperti to visu saprot.

Kādi ir daži lielu datu piemēri parastajā dzīvē?

ekrānuzņēmums http://project.wnyc.org/transit-time

Kaut arī lielākā daļa lielo datu projektu ir ļoti neskaidri, ir veiksmīgi piemēri lieliem datiem, kas ietekmē indivīdu, uzņēmumu un valdību ikdienas dzīvi:

Prognozēt vīrusa uzliesmojumus: pētot sociālpolitiskos datus, laika un klimatiskos datus un slimnīcu / klīniskos datus, šie zinātnieki tagad prognozē vēdera drudža uzliesmojumus ar 4 nedēļu iepriekšēju paziņojumu.

Slepkavību slepkavība: šie lielie datu projekti raksturo slepkavību upurus, aizdomās turētos un noziedzniekus Vašingtonā. Gan kā veids, kā cienīt mirušos, gan kā izpratnes resurss cilvēkiem, šis lielais datu projekts ir aizraujošs.

Transit Travel Planning, NYC: WNYC radio programmētājs Steve Melendez apvienoja tiešsaistes metro grafiku ar ceļojuma maršruta programmatūru. Viņa radīšana ļauj Ņujorkiešiem noklikšķināt uz viņu atrašanās vietas kartē, un tiks parādīts vilcienu un metro ceļojuma laika prognoze.

Xerox samazināja darbaspēka zaudējumu: zvanu centru darbs ir emocionāli nogurdinošs. Izmantojot profesionālos analītiķus, Xerox ir izpētījis datu plūsmu, un tagad viņi var paredzēt, kurš zvanu centru darbinieks, visticamāk, paliks uzņēmumā ar visilgāko laiku.

Atbalsts terorisma apkarošanai: pētot sociālos medijus, finanšu uzskaiti, lidojumu rezervācijas un drošības datus, tiesībaizsardzība var paredzēt un atrast teroristu aizdomās turamos, pirms viņi dara savus ļaunos darbus.

Zīmola mārketinga pielāgošana, pamatojoties uz sociālo mediju atsauksmēm : cilvēki tiešā veidā un ātri dalās savās tiešsaistes domas pub, restorānā vai fitnesa klubā. Ir iespējams pētīt šos miljonus sociālo mediju ziņu un sniegt sabiedrībai atsauksmes par to, ko cilvēki domā par saviem pakalpojumiem.

Kas izmanto lielos datus? Ko viņi ar to dara?

Daudzas monolītās korporācijas izmanto lielus datus, lai pielāgotu savus piedāvājumus un cenas, lai maksimāli palielinātu klientu apmierinātību.

Kāpēc lielie dati ir tik lieli darījumi?

4 lietas padara nozīmīgus datus:

1. Dati ir milzīgi. Tas nebūs piemērots vienam cietajam diskam , daudz mazāk - USB ligzdai . Datu apjoms ievērojami pārsniedz to, ko var saprast cilvēka prāts (domājiet par miljardu miljardu megabitu, pēc tam palieliniet to vairāk par miljardiem).

2. Dati ir netīri un nestrukturēti. No 50% līdz 80% lielo datu apstrādes ir informācijas konvertēšana un tīrīšana tā, lai tā būtu atrodama un sakārtojama. Tikai daži tūkstoši mūsu planētas ekspertu pilnībā zina, kā veikt šo datu tīrīšanu. Šiem ekspertiem ir nepieciešami arī īpaši specializēti rīki, piemēram, HPE un Hadoop, lai veiktu savu kuģi. Varbūt pēc 10 gadiem lielie datu eksperti kļūs par dūmu desmitu, bet tagad viņi ir ļoti reti sastopami analītiķi un viņu darbs joprojām ir ļoti neskaidrs un garlaicīgs.

3. Dati ir kļuvuši par preci **, ko var pārdot un nopirkt. Datu tirgi pastāv, kad uzņēmumi un privātpersonas var iegādāties terabaitus sociālajos tīklos un citus datus. Lielākā daļa datu ir mākonis, jo tas ir pārāk liels, lai ietilptu vienā cietajā diskā. Datu iegādei parasti ir jāmaksā abonēšanas maksa, ja jūs pievienojat mākonis servera fermu.

** Lielo datu rīku un ideju līderi ir Amazon, Google, Facebook un Yahoo. Tā kā šie uzņēmumi apkalpo tik daudziem miljoniem cilvēku ar saviem tiešsaistes pakalpojumiem, ir loģiski, ka tie būtu datu vākšanas punkts un lielo datu analītikas vīzijas.

4. Lielo datu iespējas ir bezgalīgas. Varbūt ārsti kādu dienu prognozēs sirdslēkmes un insultu indivīdiem nedēļas pirms to notikt. Lidmašīnas un automašīnu avārijas varētu samazināt, prognozējot to mehānisko datu un satiksmes un laika apstākļu struktūru. Tiešsaistes iepazīšanās varētu būt uzlabojusies, ja jums ir lieli dati par to, kas ir saderīgs personības jums. Mūziķi varētu uzzināt, kāda mūzikas kompozīcija ir vispiemērotākā mērķa auditorijas gaumei. Uztura speciālisti varētu prognozēt, kādu kombinēto veikalu nopirktā pārtika pasliktinās vai palīdzēs personas veselības stāvoklim. Virsma ir tikai saskrāpēta, un katru nedēļu notiek lieli dati.

Lielie dati ir dīvaini

Monty Rakusen / Getty

Lielie dati ir prognozēšanas analītika: masveida nestrukturēto datu pārveidošana par kaut ko meklējamu un sortable. Šī ir netīra un haotiska telpa, kas prasa īpašas zināšanas un pacietību.

Piemēram, monolīta UPS piegādes pakalpojums. UPS programmētāji studē datus no to draiveru GPS un viedtālruņiem, lai analizētu visefektīvākos veidus, kā pielāgoties satiksmes sastrēgumiem. Šie GPS un viedtālruņa dati ir ļoti populāri, un tie nav automātiski gatavi analīzei. Šie dati iekļauti dažādās GPS un karšu datubāzēs, izmantojot dažādas viedtālruņu aparatūras ierīces. UPS analītiķi ir pavadījuši mēnešus, pārveidojot visus šos datus formātā, kuru var viegli meklēt un sakārtot. Tomēr centieni ir tā vērti. Šodien UPS ir ietaupījis vairāk nekā 8 miljonus galonu degvielas, jo viņi sāka izmantot šos lielos datu analīzes pakalpojumus.

Tā kā lielie dati ir nepatīkami un prasa tik daudz pūļu, lai tīrītu un sagatavotos izmantošanai, datu zinātnieki ir kļuvuši saukti par "datu sūtītājiem" par visu to nogurdinošo darbu, ko viņi dara. The

Tomēr katras nedēļas laikā tiek uzlabota lielu datu un prognozēšanas analīzes zinātne. Sagaidiet, ka lieli dati kļūs pieejami visiem līdz 2025. gadam.

Vai Big Data nav neuzkrītošs drauds privātumam?

Feingersh / Getty

Jā, ja mūsu likumi un privātās dzīves aizsardzības noteikumi netiek rūpīgi pārvaldīti, lielie dati nonāk privātās dzīves neaizskaramības dēļ. Tā kā Google, YouTube un Facebook jau izseko ikdienas tiešsaistes ieradumus . Jūsu viedtālrunis un skaitļošanas dzīve katru dienu atstāj digitālās pēdas, un izsmalcinātākie uzņēmumi pēta šīs pēdas.

Likumi par lieliem datiem attīstās. Privātums ir tāds stāvoklis, ka jums tagad ir jāuzņemas personiska atbildība, jo jūs vairs nevarat to sagaidīt kā noklusējuma tiesības.

Ko jūs varat darīt, lai aizsargātu jūsu konfidencialitāti:

Lielākais solis, ko varat veikt, ir padarīt ikdienas paradumus, izmantojot VPN tīkla savienojumu . VPN pakalpojums pavirzīs jūsu signālu, lai jūsu identitāte un atrašanās vieta būtu vismaz daļēji maskēta no izsekotājiem. Tas nenozīmē, ka jūs esat 100% anonīms, bet VPN ievērojami samazinās, cik daudz pasaule var novērot jūsu tiešsaistes ieradumus.

Kur es varu uzzināt vairāk par lielajiem datiem?

Monty Raskusen / Getty

Lielie dati ir aizraujoši cilvēki ar analītiķu prātiem un mīlestību pret tehnoloģiju. Ja tas ir jums, tad noteikti apmeklējiet šo interesanto lielo datu projektu lapu.