Big Data och BI

Ofta nämns Business Intelligence och Big Data i samma kontext. Men vad betyder egentligen Big Data och är det något alla kan använda sig av i sitt BI-verktyg? Svaret är oftast att det många tänker på som Big Data i själva verket inte är “big”, även om det rör sig om stora datamängder med högt värde för din verksamhet.

Illustration av BI och Big data

Business Intelligence (BI) hjälper dig och din organisation bättre förstå verksamheten genom att använda metoder, processer och system för att utvinna och strukturera data och information. Business Intelligence kombinerar ofta affärsanalys, dataextrahering, datavisualisering och själva datainfrastrukturen.

I ett BI-verktyg finns alltid data av olika slag. Ofta kommer den in i verktyget via integrationer och/eller importer. Vilken typ av data som hanteras varierar mycket beroende på typ av verksamhet. I vissa fall handlar det om data om produkter eller personal.

I andra fall rör det sig om kund- eller marknadsdata. Variationen är stor och utmaningen är ofta att prioritera vilken data som är mest relevant för just ditt förtag.

Vad är Big Data?

Gartner definierar Big Data som:

1. “Volume”: Mycket data, i storleksordningen (1 000 000 000 000 000 byte) och Exabytes (1 000 000 000 000 000 000 byte). Redan här går det att fastställa att väldigt få företag arbetar med Big Data.

2. “Variety”: En mängd olika datakällor i olika format.

3. “Velocity”: Snabbheten i ett, ofta konstant, dataflöde från de olika datakällorna, med både strukturerad och ostrukturerade data.

Andra källor pratar om så många som fem ”v”. Där även Veracity och Value är inkluderade:

4. ”Veracity”: Datakvalitet och noggrannhet, som beskriver hur mycket du kan lita på din data.

5. ”Value”: Det värde som användandet av Big Data ger ditt företag.

Ostrukturerade och strukturerade data

Man brukar ofta dela in data i ostrukturerade data och strukturerade data, det kommer hjälpa dig att fastställa Varierty, Velocity, Veracity och Value i din Big Data-användning.

Strukturerade data är organiserade på ett sätt som både datorer och människor kan läsa och analysera. Strukturerade data lagras oftast i en relationsdatabas, i form av text eller siffror, där du kan lägga in information automatiskt eller manuellt så länge du håller dig till strukturen.

Ostrukturerade data är exempelvis dokument, kalkylark, bilder, ljud och video som inte är del av en databas.

Semi-strukturerade data är exempelvis, e-post, XML (Extensible Markup Language) och EDI (Electronic Data Interchange) som saknar formell struktur, men som ändå separerar semantiska element.

Kan man ”använda” Big Data?

Var gränsen för “big” går är alltså inte bara en mängdfråga, det har också att göra med hur du använder din data, liksom de förutsättningar, mjukvaror och kompetenser du har tillgång till.

I stället för att fokusera på djupet i din data ser Gartner att datatrenden idag mer handlar om grundare data (mindre mängder) och mer bredd. Data bör enligt Gartner användas smartare och ligga närmare affären, och på så sätt skapa värde.

Det går att se Big Data som en metodik, där du med hjälp av verktyg hanterar din data på ett annat sätt än i ett BI-verktyg. Svaret på frågan om Big Data är något för dig handlar alltså om ett bredare perspektiv än vilken typ av data som avses. I flera företag är Big Data avgörande, men då därför att deras affärsmodell innebär behov som traditionella BI-verktyg inte kan möta.

Till exempel finns många konsumentföretag som utläser trender i kundbeteenden genom ostrukturerade data från sociala medier. Men exemplen är många även från andra branscher där Big Data skapar nya insikter och bättre beslut.

Vad ska en Big Data-analytiker kunna?

Eftersom användandet av Big Data skiljer sig mycket åt mellan olika verksamheter kan det vara svårt att definiera vilka kompetenser som behövs. Oftast är de som arbetar med Big Data statistiker som kan programmera (eller tvärtom). Programmering är något som en statistiker lär sig under sin utbildning idag i Sverige.

  • Programmeringsspråket SQL (Structured Query Language) brukar ofta associeras med strukturerade data.
  • R är ett programmeringsspråk helt inriktat på statistik (matematik), och ett ”statistikfullblod” i dessa sammanhang.
  • SPSS står för “Statistical Package for the Social Sciences” och används ofta inom forskning för komplexa statistiska analyser. SPSS är en programvara från 1968 och heter numer “IBM SPSS Statistics” och har sitt eget kommandospråk.
  • Pyton är ett brett programmeringsspråk och platsar därför in på den här listan, eftersom det är tillräckligt brett för att kunna programmera statistik.
  • Analysmjukvaruföretaget SAS har olika verktyg i sin produktpalett. De flesta väldigt avancerade och relaterade till Big Data. SAS har också ett eget programmeringsspråk som heter SAS.

 

Funderar du över vad ett BI-verktyg kan göra för ditt företag? Ta en titt på en 10 minuters videodemo genom att fylla i detta formulär: