10 ting du b?r, og ikke b?r, gj?re med stordata – “Big Data”

Hvorfor oss?
VIKTIGE KONKLUSJONER

Stordata - “Big data” p? engelsk, er et nytt og fremvoksende omr?de for de fleste selskaper. For ? f? det til ? fungere kreves det n?ye finjustering og bruk av beste praksis. Her er 10 viktige tips.

Big data brukes og anvendes p? tvers av flere forretningsomr?der etter hvert som dataanalyse, kunstig intelligens og maskinl?ring blir stadig mer vanlig. Med stordata analyse kan man hente ut den virkelige verdien av denne mengden data, og disse dataene kan v?re strukturerte, ustrukturerte eller halvstrukturerte.

Fremveksten av sosiale medier har gitt mange nye muligheter til ? samle inn data om kundeatferd. Her er noen eksempler:

  • Clickstream-data kommer fra interaksjoner p? nettstedet, for eksempel museklikk og skrolling p? nettsiden.
  • Sosiale bedriftsnettsteder er nettsamfunn med kunder som er villige til ? dele informasjon om kj?psatferden sin.
  • Sensorer gir data om kundenes fysiske omgivelser, for eksempel temperatur, luftfuktighet og trafikkm?nster.

Innsikten fra dataanalyse kan hjelpe organisasjoner i beslutningsprosessen. Men den virkelige fordelen med stordata oppn?s bare hvis de h?ndteres p? riktig m?te. Organisasjoner kan unng? ? g? seg vill i stordataomr?det ved ? sikre at de identifiserer utgangspunktet med enkle brukstilfeller og implementerer det for ? kontrollere resultatene raskt.

Det f?rste steget f?r man setter i gang et big data -initiativ, er god planlegging. En organisasjon m? v?re klar over form?let med prosjektet. De b?r ogs? identifisere hvilken verdi de ?nsker ? hente ut, og hvordan det vil p?virke forretningsbeslutningene. Det mest lovende omr?det b?r velges til ? begynne med.

I denne artikkelen skal vi se n?rmere p? hva man b?r og ikke b?r gj?re i forbindelse med stordatainitiativer.

1. Kjenn form?let og utgangspunktet

Form?let med datainnsamlingen og identifisering av utgangspunktet er helt avgj?rende for at et stordata prosjekt skal lykkes. Til ? begynne med b?r m?let v?re ? identifisere de mest lovende bruksomr?dene for virksomheten. Det vil hjelpe organisasjonen med ? identifisere komponentene for disse bruksomr?dene.

Deretter b?r man planlegge hvordan man kan bruke Big Data -teknikker p? disse bruksomr?dene og hente ut verdifull innsikt som kan bidra til virksomhetens vekst. Prioriteringen av utf?relsen b?r avhenge av faktorer som f.eks:

  • Kostnad for implementering.
  • Forventet innvirkning p? virksomheten.
  • Hvor lang tid det tar ? starte opp.
  • Rask implementering.

Organisasjoner b?r alltid starte med en enkel og lett implementerbar applikasjon som et pilotprosjekt.

2. Evaluer datalisenser p? riktig m?te

Data er drivkraften i alle stordata- og analyseprosjekter. Det er derfor sv?rt viktig ? beskytte dataene mot misbruk. F?r du gir datatilgang til en leverand?r eller tredjepartsbruker, m? du s?rge for at lisensvilk?rene er p? plass. Datalisensen b?r inneholde f?lgende grunnleggende punkter. Merk at lisensavtalen inneholder ogs? mange andre viktige parametere.

  • Hvem skal bruke dataene?
  • Hvilke data vil v?re tilgjengelige?
  • Hvordan skal dataene brukes?

Dersom lisensieringen svikter, vil tap og misbruk av data utvilsomt ha en negativ innvirkning p? virksomheten.

3. Tillat demokratisering av data

Datademokratisering kan defineres som en kontinuerlig prosess der alle i en organisasjon f?r tilgang til dataene. Medarbeiderne i en organisasjon b?r v?re komfortable med ? jobbe med dataene og uttrykke sin mening p? en trygg m?te.

Datademokratisering hjelper organisasjoner med ? bli mer fleksible og ta datainformerte forretningsbeslutninger. Dette kan oppn?s ved ? etablere en god prosess. For det f?rste b?r dataene v?re tilgjengelige for alle niv?er, uavhengig av organisasjonsstruktur. For det andre b?r det etableres én enkelt sannhetskilde (kalt “den gylne kilden”) etter at dataene er validert. For det tredje b?r alle ha mulighet til ? sjekke dataene og komme med innspill. For det fjerde kan de nye ideene testes ved ? ta kalkulert risiko. Hvis den nye ideen er vellykket, kan organisasjonen g? videre, hvis ikke kan den anses som en l?rdom.

4. Bygg opp en samarbeidskultur

N?r det gjelder stordata, er samarbeid mellom ulike avdelinger og grupper i en organisasjon sv?rt viktig. Et stordata initiativ kan bare lykkes n?r det bygges en god organisasjonskultur p? tvers av alle lag, uavhengig av roller og ansvarsomr?der.

Ledelsen i en organisasjon b?r ha en klar visjon for fremtiden og oppmuntre til nye ideer. Alle ansatte og deres avdelinger b?r f? lov til ? finne muligheter og utvikle konsepter for ? validere dem. Det skal ikke v?re noen politikk som klandrer og stopper spillet. Det er alltid en l?ringsprosess, og b?de suksess og fiasko m? aksepteres i like stor grad.

5. Evaluer infrastrukturen for stordata

Infrastrukturdelen av ethvert projekt med big data er like viktig. Datavolumet m?les i petabyte, og dataene behandles for ? gi innsikt. Derfor m? b?de lagrings- og prosesseringsinfrastrukturen evalueres p? riktig m?te.

Datasentre brukes til lagringsform?l og m? derfor evalueres med tanke p? kostnadskomponenter, administrasjon, back-up, p?litelighet, sikkerhet, skalerbarhet og mange andre faktorer. (Les ogs?: 6 viktige risikoer ved offentlige nettskyer).

P? samme m?te m? behandlingen av stordata og den tilh?rende teknologiske infrastrukturen kontrolleres n?ye f?r avtalen inng?s. Skytjenester er generelt sv?rt fleksible n?r det gjelder bruk og kostnader. Blant de etablerte skyleverand?rene finner vi store akt?rer som AWS, Azure og GCP, men det finnes mange flere p? markedet.

6. Ikke g? deg vill i mengden av data

God datastyring er sv?rt viktig for ? lykkes med stordata prosjekter. En god strategi for datainnsamling b?r planlegges f?r implementeringen. Generelt er det en tendens til ? samle inn alle eldre data i en virksomhet. Men det er ikke sikkert at alle disse dataene passer godt inn i dagens forretningsscenarioer. Derfor er det viktig ? f?rst identifisere virksomhetens bruksomr?der og finne ut hvor dataene skal brukes.

N?r datastrategien er veldefinert og direkte koblet til forretningsapplikasjonen, kan neste trinn i implementeringen planlegges. Etter dette kan nye data legges til for ? forbedre modellen og dens effektivitet.

7. Ikke glem ?pen kildekode

Nytten av teknologien du vurderer, b?r vurderes ut fra prosjektets st?rrelse og organisasjonens budsjett. Mange plattformer med ?pen kildekode er gratis tilgjengelige for pilotprosjekter. Sm? og mellomstore organisasjoner kan utforske disse open sourc e-l?sningene for ? komme i gang med stordata. Organisasjonens fokus b?r v?re p? resultatet og avkastningen.

Hadoop er et rammeverk for programvare med ?pen kildekode som bruker HDFS (Hadoop Distributed File System) og MapReduce til ? analysere stordata p? klynger av maskinvare – det vil si i et distribuert databehandlingsmilj?. (Les: Hvordan kan jeg bruke Hadoop til ? analysere stordata?)

Big Data -bevegelsen har modnet til et punkt der Hadoop har blitt de facto-standarden for behandling av stordata. MapReduce er en programmeringsmodell for ? distribuere data og behandle dem parallelt i en klynge av datamaskiner ved hjelp av enkle programmeringsmodeller. Den ble utviklet av Google for effektiv behandling av store datamengder p? store dataklynger.

8. Ikke start uten skikkelig planlegging

Det er en sv?rt farlig trend ? starte alle stordataprosjekter p? én gang. Denne tiln?rmingen vil sannsynligvis bare f?re til delvis suksess eller total fiasko. Organisasjoner b?r planlegge skikkelig f?r de setter i gang med stordatainitiativer, i stedet for ? satse alt p? én gang. Det anbefales alltid ? starte med en enkel, liten og m?lbar applikasjon.

N?r pilotprosjektet er vellykket, kan det implementeres i st?rre skala. Det er viktig ? ta seg tid til ? utvikle en plan og velge pilotprosjektet med omhu.

9. Ikke fors?m sikkerheten

Datasikkerhet er et annet viktig aspekt ved stordata prosjekter. I et stordata scenario hentes petabytevis med data fra ulike kildesystemer, som deretter behandles. De bearbeidede dataene er input til analysemodellen. Resultatet av analysen er verdifull innsikt for virksomheten. N?r r?dataene er bearbeidet og meningsfull informasjon er hentet ut fra r?dataene, er det viktig ? sikre konfidensialitet, integritet og tilgjengelighet (CIA) for denne informasjonen.

N?r dataene inneholder kritisk forretningsinformasjon, blir de verdifulle for organisasjonen. Derfor m? disse dataene sikres mot eksterne trusler. Datasikkerhet m? planlegges som en del av livssyklusen for implementering av stordata. (Les ogs?: Sikkerhet i nettskyen: 5 vanlige cybertrusler).

10. ?Ikke fokuser p? isolerte forretningsenheter

I dagens komplekse forretningsscenario hjelper det ikke ? fokusere p? én enkelt forretningsenhet. Organisasjoner b?r ha et overordnet syn p? virksomheten som helhet og tenke i et globalt perspektiv. Den beste tiln?rmingen er ? ta sm? skritt av gangen og beholde et globalt perspektiv. Fokuset b?r v?re helhetlig n?r det gjelder forretningsenheter. Det vil gi positive effekter og bedre avkastning.

Konklusjon

Det finnes ingen spesifikk vei til suksess for implementering av stordata. Det er en kombinasjon av planlegging, strategi, tiln?rming og en rekke andre faktorer som f?rer til suksess.

Hver organisasjon har et spesifikt m?l ? oppn?, s? strategien b?r planlegges deretter, pilotprosjektet m? velges med omhu, og den resulterende informasjonen m? beskyttes og behandles p? riktig m?te. Det er ogs? en rekke akt?rer som kan hjelpe med big data og big data analytics er en stadig voksende bransje, med en rekke programmer som kan hjelpe deg.

Related Articles

Kaushik Pal
Technology Specialist
Kaushik Pal
Teknologiskribent

Kaushik er en teknisk arkitekt og programvarekonsulent med over 23 ?rs erfaring innen programvareanalyse, utvikling, arkitektur, design, testing og oppl?ring. Han har interesse for nye teknologier og innovasjonsomr?der. Han fokuserer p? webarkitektur, webteknologier, Java/J2EE, ?pen kildekode, WebRTC, stordata og semantiske teknologier. Han har demonstrert ekspertise innen kravsanalyse, arkitektonisk design og implementering, tekniske bruksm?nstre og programvareutvikling. Hans erfaring dekker forskjellige bransjer som forsikring, bank, flyselskaper, shipping, dokumenth?ndtering og produktutvikling, osv. Han har jobbet med et bredt spekter av teknologier som spenner fra stor skala (IBM S/390), medium skala (AS/400), webteknologier, ?pen kildekode og stordata. Kaushik er hovedsakelig involvert i Java/J2EE/Open Source/Web/WebRTC/Hadoop…

',a='';if(l){t=t.replace('data-lazy-','');t=t.replace('loading="lazy"','');t=t.replace(/