Päivä datatieteilijän elämässä
BrainStationin Data Scientist -uraopas voi auttaa sinua ottamaan ensimmäiset askeleet kohti tuottoisaa uraa datatieteessä. Lue tästä yleiskatsaus siihen, kuinka datatieteilijät viettävät päivänsä töissä.
Ryhdy datatieteilijäksi
Keskustele oppimisneuvojan kanssa saadaksesi lisätietoja siitä, kuinka käynnistysleirit ja -kurssit voivat auttaa sinua tulemaan datatieteilijäksi.
Napsauttamalla Lähetä hyväksyt meidän Ehdot .
Lähetä
Ei voitu lähettää! Päivitetäänkö sivu ja yritetäänkö uudelleen?
Lue lisää Data Science BootcampistammeKiitos!
Otamme pian yhteyttä.
Näytä Data Science Bootcamp -sivu
Päivä datatieteilijän elämässä
Kaikista Brainstationin Digital Skills Survey -tutkimuksessa tutkituista tieteenaloista datatiede voi kattaa laajimman valikoiman sovelluksia. Mutta vaikka datatiede on ollut olemassa vuosikymmeniä, se on vasta äskettäin tullut täyteen kukoistukseen. Kun datan saatavuus on laajentunut, yritykset ovat ymmärtäneet, kuinka tärkeää datatiede voi olla, sanoo Briana Brownell, Pure Strategyn perustaja ja toimitusjohtaja sekä datatutkija 13 vuotta. Jokaisen yrityksen on nyt keskityttävä osittain teknologiaan. Juuri tällä viikolla esimerkiksi McDonald's maksoi arviolta 300 miljoonaa dollaria ostaakseen oman ison datayrityksen.
Ei siis ihme, että kilpailu datatieteilijöistä on uskomattoman kovaa. Vain kahdessa vuodessa kysynnän odotetaan kasvavan 28 prosenttia, mikä vastaa noin 2,7 miljoonaa uutta työpaikkaa. Se on enemmän paikkoja kuin uudet valmistuneet pystyvät täyttämään – mikä tarkoittaa, että muiden alojen teknologiatyöntekijöiden on hiottava taitojaan ja siirryttävä tietoihin vastatakseen tähän tarpeeseen.
Itse asiassa kyselymme viittaa siihen, että tämä tapahtuu jo. Noin neljä viidestä data-ammattilaista aloitti uransa tekemällä jotain muuta, ja 65 prosenttia kaikista datatieteilijöistä on työskennellyt alalla viisi vuotta tai vähemmän. Tällä valtavalla uusien mielien tulolla on kaksiteräinen vaikutus, Brownell sanoo; Toisaalta on tulossa paljon uusia ideoita, hän sanoo. Kun katson osaa datatiedeyhteisöstä tulevasta sisällöstä, olen yllättynyt, kuinka paljon innovaatioita siellä on. Kääntöpuoli on kuitenkin taipumus keksiä pyörä uudelleen.
Data Scientists on suuri kysyntä, jos olet sellainen (tai harkitset sellaiseksi tulemista), mutta työnantajille rekrytointi voi olla pelottava haaste. Tässä uudelleenkoulutus on ilmeinen ratkaisu; voi olla kustannustehokkaampaa kouluttaa nykyinen työntekijä uudelleen tietotieteeseen kuin etsiä uutta.
Mutta vaikka aiot palkata uuden datatieteiden tiimin, organisaatiosi kokonaisuutena saattaa joutua parantamaan tietolukutaitoaan, Brownell varoittaa. Jokainen haluaa työskennellä sellaisen parissa, joka vaikuttaa heidän työpaikalleen, mikä parantaa ihmisten elämää, hän sanoo. Jos yrityskulttuurisi ei ole sellainen, että [tietotieteilijäsi] voi vaikuttaa, on lähes mahdotonta palkata. Johdon on kyettävä paitsi kommunikoimaan mahdollisille työntekijöille siitä, kuinka he voivat osallistua, vaan myös ymmärtämään ehdotukset, jotka heidän tietotieteiden tiiminsä lopulta esittää.
Valitettavasti Brownell sanoo, että epämiellyttävä enemmistö on yrityksiä, jotka eivät ole ymmärtäneet asioita. Kyselymme tukee tätä: suurin osa vastaajista (52 prosenttia) kuvaili tietolukutaidon tasoa organisaatioissaan perustason, ja keskitaso oli seuraavaksi yleisin vastaus (31 prosenttia). Tämä viittaa siihen, että tietotekniikan peruskoulutus voisi olla hyödyllinen suurimmalle osalle yrityksiä – erityisesti johtajuudessa.
Tätä tarvetta parantaa tietolukutaitoa – ja viestintää – lisää tapa, jolla useimmat tietotieteiden tiimit on rakennettu: erillisenä tiiminä, jossa on yleensä enintään 10 henkilöä (71 prosentin vastaajista) ja usein viisi tai vähemmän (38 prosenttia). ). Näillä tiiviillä joukkueilla ei ole varaa olla eristyksissä. Suuremmissa yrityksissä työskentelevät henkilöt ovat yleensä pienessä datatiedekohtaisessa ryhmässä, ja heidän asiakkaansa ovat sisäisiä organisaation muita osia, Brownell selittää, joten kyseessä on tiimi, jonka on toimittava organisaation monilla eri alueilla.
Mitä datatiede oikein on?
Yleinen käsitys (että Data Scientists murskaavat numerot) ei ole liian kaukana merkistä, Brownell sanoo. On olemassa monia tietojoukkoja, joista on saatava oivalluksia, ja siihen sisältyy monia vaiheita, kuten mallin rakentaminen ja tietojen puhdistaminen, ja jopa vain tarvitsemiesi tietojen päättäminen. Viime kädessä tämä pyrkimys on kuitenkin tavoitteellinen: ytimessä sinun on tehtävä jotain tiedoilla.
Data ei aina ole numeroita. Vaikka suurin osa vastaajista (73 prosenttia) ilmoitti työskentelevänsä numeerisen datan parissa, 61 prosenttia sanoi työskentelevänsä myös tekstin, 44 prosenttia strukturoidun datan, 13 prosenttia kuvien ja 12 prosenttia grafiikan parissa (ja pienet vähemmistöt työskentelevät jopa videon ja äänen kanssa —6 prosenttia ja 4 prosenttia). Nämä tutkimustulokset vihjaavat tavoista, joilla datatiede laajenee paljon taloudellisia taulukoita pidemmälle, houkuttelee ihmisiä sellaisiin projekteihin kuin asiakastyytyväisyyden maksimointi tai arvokkaiden oivallusten kerääminen sosiaalisen median paloletkusta.
Tämän seurauksena datatieteen alalla on valtava valikoima, Brownell sanoo. Jokaisella toimialalla on oma näkemyksensä siitä, minkä tyyppistä dataa datatieteilijät työskentelevät, minkä tyyppisiä tuloksia he odottavat ja miten se sopii heidän yrityksensä johtamisrakenteeseen. Tavoitteena on kuitenkin joka tapauksessa hyödyntää dataa auttamaan yritystä tekemään parempia päätöksiä. Se voisi olla tuotteiden parantamista, markkinoiden ymmärtämistä, joille he haluavat mennä, enemmän asiakkaita, heidän työvoiman käytön ymmärtämistä, ymmärrystä, kuinka tehdä hyviä työsuhteita – kaikenlaisia eri asioita.
Tietotekniikan työpaikat
Joillakin tekniikan aloilla generalistiksi tuleminen voi olla paras jalkasi oven takana – ei niin datatieteessä. Työnantajat etsivät yleensä alalleen erikoistuneita taitoja. Koska datatieteellä on niin monia eri makuja, tutkimuksemme tutkittiin syvällisemmin ja tarkasteltiin viittä päätyöluokkaa: Data-analyytikko, tutkija, yritysanalyytikko, data- ja analyytikkopäällikkö ja varsinainen datatutkija.
Kaikilla näillä ammattinimikkeillä tietojen riiteleminen ja siivoaminen vievät suurimman osan ajasta – mutta mihin tarkoitukseen? Useimmiten tavoitteena on optimoida olemassa oleva alusta, tuote tai järjestelmä (45 prosenttia) tai kehittää uusia (42 prosenttia). Kaivaessamme syvemmälle havaitsimme, että olemassa olevien ratkaisujen optimointi jää yleensä yritysanalyytikoille ja data-analyytikoille, kun taas uusien ratkaisujen kehittäminen jää useammin datatieteilijöille ja tutkijoille.
Data Scientistien käyttämät tekniikat vaihtelevat myös erikoisaloilla. Lineaarinen regressio oli yleinen työkalu kaikissa luokissa, ja sen mainitsi 54 prosenttia vastaajista, mutta joitain yllätyksiä havaittiin, kun tarkastelimme ihmisten käyttämiä ohjelmistoja.
Excel – tietojoukkojen manipuloinnin työhevonen – on lähes kaikkialla, ja sen mainitsi 81 prosenttia kaikista vastaajista, ja se on suosituin työkalu kaikissa luokissa paitsi Data Scientists (jotka luottavat useimmiten Pythoniin) ja mainitsi myös suuremman työkalupaketin kuin muut kategoriat. ). Mikä tekee Excelistä niin väistämättömän jopa vuonna 2019?
Rakastan Excelissä sitä, kuinka sen avulla voit nähdä tiedot ja saada niistä intuitiivisen tunteen, Brownell selitti. Käytämme myös paljon Pythonia, ja siinä tapauksessa, kun teet analytiikkaa datatiedostolle, se on piilotettu; ellet erityisesti ohjelmoi osaa koodistasi visualisoimaan analysoimaasi raakadataa, et näe sitä. Kun taas Excelissä se on aivan edessäsi. Siitä on paljon etuja. Joskus voit havaita ongelmia datatiedoston kanssa. En näe Excelin katoavan koskaan analyysistä.
Siitä huolimatta, että alalla on vielä pitkä lista muita ohjelmia - ei ole yllättävää sen monimuotoisuuden vuoksi. SQL (43 prosenttia) ja Python (26 prosenttia) johtavat suosiossa, ja Tableau (23 prosenttia), R (16 prosenttia), Jupyter Notebooks (14 prosenttia) ja kourallinen muita ovat saavuttaneet merkittäviä lukuja – puhumattakaan huikeasta. 32 prosenttia vastaajista, jotka viittasivat muihin työkaluihin, vaikka tämä jo ennestään pitkä lista otetaan huomioon.
Mikä on datatieteen tulevaisuus?
Lopuksi kysyimme, mitkä trendit muokkaavat digitaalista maisemaa seuraavien 5–10 vuoden aikana. Koneoppiminen ja tekoäly – joilla molemmilla on sovelluksia datatieteessä – olivat ylivoimaisesti kehityssuuntien, joilla vastaajat odottivat olevan suurin vaikutus, vastaavasti 80 prosenttia ja 79 prosenttia. Tämä huolimatta siitä, että alle neljännes (23 prosenttia) heistä työskentelee tällä hetkellä tekoälyn kanssa.
Tekoäly voi täysin muuttaa datatieteen, vahvistaa Brownell, jonka yritys kehittää tekoälytuotteita. Se on todella valvomattomien oppimismenetelmien loisto. Meillä on vain niin paljon aikaa tarkastella näitä tietojoukkoja, ja varsinkin suurilla on erittäin vaikea tehdä kaikkea. AI-työkalut voivat auttaa paljastamaan jotain, jota et ehkä olisi ajatellut etsiä. Meillä on ehdottomasti käynyt niin.
Muita trendejä Data Tiedemiehet odottavat hallitsevansa lähitulevaisuudessa: esineiden internet (51 prosenttia), lohkoketju (50 prosenttia) ja sähköinen kaupankäynti (36 prosenttia), lisätty todellisuus ja virtuaalitodellisuus (38 prosenttia ja 27 prosenttia) ja jopa ääni- perustuvat kokemukset (25 prosenttia) – kaikki merkittävät näytökset ja kaikki alueet, joilla datatiedettä voidaan käyttää hyväksi.