Tietojen tutkija
BrainStationin Data Scientist -uraopas voi auttaa sinua ottamaan ensimmäiset askeleet kohti tuottoisaa uraa datatieteessä. Lue lisää datatieteen alasta sekä Data Scientist -työn roolista.
Ryhdy datatieteilijäksi
Keskustele oppimisneuvojan kanssa saadaksesi lisätietoja siitä, kuinka käynnistysleirit ja -kurssit voivat auttaa sinua tulemaan datatieteilijäksi.
Napsauttamalla Lähetä hyväksyt meidän Ehdot .
Lähetä
Ei voitu lähettää! Päivitetäänkö sivu ja yritetäänkö uudelleen?
Lue lisää Data Science BootcampistammeKiitos!
Otamme pian yhteyttä.
Näytä Data Science Bootcamp -sivu
Mikä on datatieteilijä?
Data Scientistit keräävät, järjestävät ja analysoivat suuria ryhmiä big dataa – strukturoitua ja strukturoimatonta dataa – luodakseen toimivia datapohjaisia liiketoimintaratkaisuja ja suunnitelmia yrityksille ja muille organisaatioille. Yhdistämällä ymmärryksen matematiikasta, tietojenkäsittelytieteestä ja liiketoiminnasta, datatieteilijöillä on oltava sekä tekniset taidot käsitellä ja analysoida big dataa että liikekykyä löytääkseen dataan piilotettuja oivalluksia.
Tietotiede vs. tiedon louhinta
Datatieteen ja tiedon louhinnan välillä on muutamia eroja. Katsotaanpa tarkemmin:
Tietotiede
- Se on laaja ala, joka sisältää yleensä koneoppimisen, tekoälyn, ennustavan kausaalianalytiikan ja ohjeellisen analytiikan
- Käsittelee kaikenlaista dataa, mukaan lukien sekä strukturoitua että strukturoimatonta dataa
- Tavoitteena on rakentaa datakeskeisiä tuotteita ja tehdä datalähtöisiä päätöksiä
- Keskittyy tietojen ja kuvioiden tieteelliseen tutkimukseen
Tietojen louhinta
- On datatieteen osajoukko, joka sisältää tietojen puhdistamisen, tilastollisen analyysin ja hahmontunnistuksen, ja joskus se sisältää tietojen visualisoinnin, koneoppimisen ja tietojen muuntamisen
- Käsittelee ensisijaisesti strukturoitua dataa, ei strukturoimatonta dataa
- Tavoitteena on ottaa tietoa eri lähteistä ja tehdä siitä käyttökelpoinen
- Keskittyy liiketoimintakäytäntöihin
Mitä datatieteilijä tekee?
Data Scientist analysoi suuria datajoukkoja paljastaakseen malleja ja trendejä, jotka johtavat toimiviin liiketoimintatietoihin ja auttavat organisaatioita ratkaisemaan monimutkaisia ongelmia tai tunnistamaan tulon- ja kasvumahdollisuuksia. Data Scientist voi työskennellä käytännössä kaikilla aloilla, ja hänen on oltava taitava käsittelemään strukturoituja ja jäsentelemättömiä tietojoukkoja. Se on monialainen työ, ja tullaksesi tietotieteilijäksi, sinulla on oltava matematiikka, tietojenkäsittely, liiketoiminta ja viestintä, jotta voit suorittaa työsi tehokkaasti.
Vaikka Data Scientistin erityiset työtehtävät ja vastuut vaihtelevat suuresti toimialan, aseman ja organisaation mukaan, useimpiin datatutkijan tehtäviin sisältyy seuraavat vastuualueet:
Tutkimus
Datatieteilijän on ymmärrettävä sekä toimialalle että yksittäiselle yritykselle ominaiset mahdollisuudet ja kipukohdat.
Valmistellaan tietoja
Ennen kuin arvokkaita oivalluksia voidaan löytää, datatieteilijän on määriteltävä, mitkä tietojoukot ovat hyödyllisiä ja merkityksellisiä, ennen kuin se kerää, poimii, puhdistaa ja soveltaa strukturoitua ja strukturoimatonta dataa useista eri lähteistä.
Mallien ja algoritmien luominen
Koneoppimisen ja tekoälyn periaatteita käyttäen tietotutkijan tulee pystyä luomaan ja soveltamaan automaation työkalujen toteuttamiseen tarvittavia algoritmeja.
Tietojen analysointi
Tietotutkijan on tärkeää pystyä analysoimaan tietojaan nopeasti tunnistaakseen malleja, trendejä ja mahdollisuuksia.
Visualisointi ja viestintä
Datatieteilijän on kyettävä kertomaan datan kautta löydetyt tarinat luomalla ja järjestämällä esteettisesti houkuttelevia kojetauluja ja visualisointeja, samalla kun hänellä on oltava kommunikaatiotaidot vakuuttaa sidosryhmät ja muut tiimin jäsenet siitä, että datan havaintojen perusteella kannattaa toimia.
Viimeisimmän BrainStationin Digital Skills Surveyn mukaan data-ammattilaiset käyttivät suurimman osan ajastaan tietojen riitelemiseen ja puhdistamiseen. Vastaajat totesivat myös, että heidän työnsä tavoitteena on useimmiten olemassa olevan alustan, tuotteen tai järjestelmän optimointi (45 prosenttia) tai uusien kehittäminen (42 prosenttia).
Tietotieteen tyypit
Datatieteen laajempi kenttä sisältää monia erilaisia tieteenaloja, mukaan lukien:
Tietotekniikka
Tietoa tukevan infrastruktuurin suunnittelu, rakentaminen, optimointi, ylläpito ja hallinta sekä tiedonkulkua koko organisaatiossa.
Tietojen valmistelu
Tietojen puhdistaminen ja muuntaminen.
Tiedon louhinta
Käyttökelpoisten tietojen poimiminen (ja joskus puhdistaminen ja muuntaminen) suuremmasta tietojoukosta.
Ennakoiva analytiikka
Tietojen, algoritmien ja koneoppimistekniikoiden avulla analysoidaan erilaisten mahdollisten tulevien tulosten todennäköisyyttä data-analyysin perusteella.
Koneoppiminen
Automatisoi analyyttisten mallien rakentaminen data-analyysiprosessissa, jotta tiedoista voidaan oppia, havaita malleja ja valtuuttaa järjestelmät tekemään päätöksiä ilman paljon ihmisen väliintuloa.
Tietojen visualisointi
Visuaalisten elementtien (kuten kaavioiden, karttojen ja kaavioiden) käyttö havainnollistaa tiedoista löytyviä oivalluksia helposti saatavilla olevalla tavalla, jotta yleisö voi ymmärtää tiedoista löytyviä trendejä, poikkeavuuksia ja malleja.
Datatieteen edut
Yritykset kaikilla toimialoilla eri puolilla maailmaa omistavat yhä enemmän rahaa, aikaa ja huomiota datatieteeseen ja haluavat lisätä tiimiinsä datatieteilijän. Tutkimukset osoittavat, että yritykset, jotka todella omaksuvat datalähtöisen päätöksenteon, ovat tuottavampia, kannattavampia ja tehokkaampia kuin kilpailijat.
Datatiede on ratkaisevan tärkeä auttaessa organisaatioita tunnistamaan oikeat ongelmat ja mahdollisuudet samalla kun se auttaa muodostamaan selkeän kuvan asiakkaiden ja asiakkaiden käyttäytymisestä ja tarpeista, työntekijöiden ja tuotteiden suorituskyvystä sekä mahdollisista tulevaisuuden ongelmista.
Datatiede voi auttaa yrityksiä:
- Tee parempia päätöksiä
- Lisätietoja asiakkaista ja asiakkaista
- Hyödynnä trendejä
- Ennakoi tulevaisuutta
Miten datatiede voi lisätä arvoa yritykselle?
Datatiede on yhä suositumpi sijoituskohde yrityksille, koska potentiaalinen ROI suurdatan arvon vapauttamisessa on valtava. Datatiede on kannattava investointi, koska:
- Kuinka perinteinen yrityksesi on. Suuremmat, vanhemmat yritykset eivät yleensä ole yhtä etäystävällisiä – vaikka COVID on saattanut tuoda suuria muutoksia tällä alueella.
- Kuinka helposti voit työskennellä muiden tiimitovereiden ja osastojen kanssa etänä. Jos työsi on erittäin yhteistyökykyistä, sinun tulee todennäköisemmin saapua paikalle henkilökohtaisesti.
- Sopimus- tai jopa konsultointiperusteisesti työskentelevillä datatieteilijöillä voi myös olla enemmän joustavuutta oman sijaintinsa valinnassa.
Palkat datatieteilijöille
Vaikka Data Scientists -työntekijöiden palkat vaihtelevat suuresti alueittain ja toimialoittain, datatutkijan keskipalkka Yhdysvalloissa on 96 000 - 113 000 dollaria lähteestä riippuen. Vanhempi datatieteilijä voi tuoda keskimäärin noin 130 000 dollaria.
Tietotieteilijöiden kysyntä
Data Scientists on suuri kysyntä ja pulaa lähes kaikilla toimialoilla. Deloitte Access Economicsin raportissa todettiin, että 76 prosenttia yrityksistä suunnitteli lisäävänsä menojaan seuraavien vuosien aikana data-analyyttisiin ominaisuuksiin, kun taas IBM ennusti datatieteen kysynnän kasvavan 28 prosenttia vuosikymmenen alussa.
Yhdysvaltain työtilastovirasto on ennustanut datatieteen kasvavan 31 prosenttia seuraavan 10 vuoden aikana. Sillä välin Markets and Markets -raportti havaitsi, että big datan globaalien markkinoiden ennustetaan kasvavan 229,4 miljardiin dollariin vuoteen 2025 mennessä ja datatieteen alustan kasvavan 30 prosenttia vuoteen 2024 mennessä.
Näyttää siltä, että kaikkialla maailmassa datatieteeseen investoinnit ja sitä kautta Data Scientists -kysynnän odotetaan kasvavan.
Mitä työkaluja datatieteilijät käyttävät?
Tietotieteilijät käyttävät erilaisia työkaluja ja ohjelmia toimintoihin, kuten tietojen analysointiin, tietojen puhdistamiseen ja visualisointien luomiseen.
Python on BrainStation Digital Skills Survey -tutkimuksessa kyselyyn vastanneiden datatieteilijöiden paras ohjelmointikieli. Python on yleiskäyttöinen ohjelmointikieli, joka on hyödyllinen National Language Processing -sovelluksissa ja tietojen analysoinnissa. R:tä käytetään usein myös data-analyysiin ja tiedon louhintaan. Hadoop-pohjaiset työkalut, kuten Hive, ovat suosittuja raskaampaan numeronmurskaamiseen. Koneoppimiseen tietotutkijat voivat valita useista työkaluista, kuten h2o.ai, TensorFlow, Apache Mahout ja Accord.Net. Visualisointityökalut ovat myös tärkeä osa Data Scientistin arsenaalia. Ohjelmat, kuten Tableau, PowerBI, Bokeh, Plotly ja Infogram, auttavat Data Scientists -työntekijöitä luomaan visuaalisesti houkuttelevia kaavioita, lämpökarttoja, grafiikkaa, sirontakaavioita ja paljon muuta.
Tietojen tutkijoiden tulee myös olla erittäin tottuneet käyttämään sekä SQL:ää (käytetään useilla alustoilla, mukaan lukien MySQL, Microsoft SQL ja Oracle) että taulukkolaskentaohjelmia (yleensä Excel).
Mitä taitoja datatieteilijät tarvitsevat?
On olemassa useita taitoja, joita kaikkien pyrkivien datatieteilijöiden tulisi kehittää, mukaan lukien:
Tietotieteilijän urapolut
Suhteellisen uutena ammatina Data Scientistin urapolut eivät ole kiveen kirjoitetut, ja monet ihmiset löytävät tiensä datatieteeseen tietojenkäsittelytieteen, IT:n, matematiikan ja liiketalouden taustoista. Mutta datatieteilijän urapolun neljä pääakselia ovat yleensä data, suunnittelu, liiketoiminta ja tuote. Monet datatieteen monialaiset roolit edellyttävät useiden tai kaikkien näiden alueiden hallintaa.
Datatieteen parissa työskentelevät ihmiset ovat tulevaisuuteen eniten vaikuttavien teknologisten muutosten eturintamassa. Koska datatiede voi edistää edistystä käytännössä kaikilla muilla aloilla, Data Scientists pystyy jatkamaan tutkimusta kaikessa rahoituksesta ja kaupasta vakuutusmatemaattisiin tilastoihin, vihreään energiaan, epidemiologiaan, lääketieteeseen ja lääkkeisiin, televiestintään – luettelo on käytännössä loputon. Jokainen toimiala liikennöi omalla erityyppisellä datallaan ja hyödyntää sitä eri tavoilla saavuttaakseen eri tavoitteet. Missä tahansa näin tapahtuu, datatieteilijät voivat ohjata parempaa päätöksentekoa, olipa kyseessä sitten tuotekehitys, markkina-analyysi, asiakassuhteiden hallinta, henkilöstöresurssit tai jotain muuta.
Datatieteen sovellukset eivät ole vain laajoja ja koskettavat monia eri sektoreita, vaan myös datatieteen tyyppejä on erilaisia. Kaikille näille toiminnoille yhteistä on se, että ne kaikki yrittävät muuttaa dataa tiedoksi. Tarkemmin sanottuna Data Scientists käyttävät metodista lähestymistapaa raakadatan järjestämiseen ja analysoimiseen tunnistaakseen kuvioita, joista voidaan tunnistaa tai päätellä hyödyllistä tietoa.
Kun otetaan huomioon niiden vaikutusten laajuus, ei ole ihme, että datatieteilijät ovat erittäin vaikutusvaltaisia ja erittäin kysyttyjä tehtäviä. Vaikka tie datatieteilijäksi tulemiseen voi olla vaativa, tavoitteellisille datatieteilijöille on nyt enemmän resursseja kuin koskaan ja heillä on enemmän mahdollisuuksia rakentaa haluamaansa uraa.
Mutta kaikilla tavoilla, joilla datatieteilijät voivat osallistua eri toimialoihin ja kaikilla erilaisilla urapoluilla, joita datatieteilijä voi seurata, heidän tekemänsä työtyypit voidaan jakaa muutamaan pääluokkaan. Kaikki datatiede ei sovi siististi näihin ryhmiin, etenkään tietojenkäsittelytieteen eturivissä, jossa uusia maata murretaan jatkuvasti – mutta ne antavat sinulle jonkinlaisen käsityksen tavoista, joilla datatieteilijät muuttavat dataa oivallukseksi.
Tilastot
Datatieteen ytimessä tilastot ovat matematiikan ala, joka kuvaa tietojoukon erilaisia ominaisuuksia, oli kyseessä sitten numeroita, sanoja, kuvia tai jotain muuta mitattavissa olevaa tietoa. Suurin osa tilastoista keskittyy yksinkertaisesti identifioimaan ja kuvaamaan, mitä siellä on – varsinkin kun on kyse erittäin suurista tietojoukoista, pelkkä tieto siitä, mitä tieto sisältää ja mitä se ei sisällä, on oma tehtävä. Datatieteen alalla tätä kutsutaan usein kuvailevaksi analytiikaksi. Tilastot voivat kuitenkin mennä vielä pidemmälle ja testata, ovatko olettamuksesi oikeita tietojen sisällöstä tai, jos ne ovat oikeita, ovatko ne merkityksellisiä tai hyödyllisiä. Tämä ei voi tarkoittaa vain tietojen tutkimista, vaan myös niiden manipulointia sen tärkeimpien piirteiden tuomiseksi esiin. On monia erilaisia tapoja tehdä tämä – lineaarinen regressio, logistinen regressio ja erotteluanalyysi, erilaiset näytteenottomenetelmät ja niin edelleen – mutta viime kädessä jokainen näistä tekniikoista on tietojoukon ominaisuuksien ymmärtämistä ja näiden ominaisuuksien tarkkuutta. heijastavat jotakin merkityksellistä totuutta maailmasta, jota he vastaavat.
Tietojen analysointi
Vaikka se on rakennettu tilastojen pohjalle, data-analyysi menee hieman pidemmälle kausaliteetin ymmärtämisessä, visualisoinnissa ja havaintojen välittämisessä muille. Jos tilastot määrittelevät tietojoukon mitä ja milloin, data-analyysi yrittää tunnistaa miksi ja miten. Dataanalyytikot tekevät tämän puhdistamalla tiedot, tekemällä niistä yhteenvedon, muuntamalla niitä, mallintamalla ja testaamalla. Kuten edellä mainittiin, tämä analyysi ei rajoitu pelkästään numeroihin. Vaikka suuri osa data-analyysistä käyttää numeerista dataa, on mahdollista analysoida myös muun tyyppistä dataa – esimerkiksi kirjallista asiakaspalautetta tai sosiaalisen median julkaisuja tai jopa kuvia, ääntä ja videota.
Yksi Data-analyytikoiden päätavoitteista on ymmärtää syy-seuraus, jonka avulla voidaan ymmärtää ja ennustaa trendejä useissa eri sovelluksissa. Diagnostisessa analyysissä dataanalyytikot etsivät korrelaatioita, jotka ehdottavat syytä ja seurausta, ja tätä tietoa voidaan puolestaan käyttää tulosten muokkaamiseen. Ennakoiva analyysi etsii samoin kuvioita, mutta laajentaa niitä sitten edelleen ekstrapoloimalla niiden liikeradat tunnetun datan ulkopuolelle, mikä auttaa ennustamaan, kuinka mittaamattomat tai hypoteettiset tapahtumat - mukaan lukien tulevat tapahtumat - voivat toteutua. Tietojen analyysin edistyneimmät muodot pyrkivät antamaan ohjeita tiettyihin päätöksiin mallintamalla ja ennustamalla eri vaihtoehtojen tuloksia sopivimman toimintatavan tunnistamiseksi.
Tekoäly ja koneoppiminen
Yksi datatieteessä tällä hetkellä tapahtuvista suurista edistysaskeleista – ja se, jolla on tulevaisuudessa valtava vaikutus – on tekoäly ja tarkemmin sanottuna koneoppiminen. Lyhyesti sanottuna koneoppiminen tarkoittaa tietokoneen kouluttamista suorittamaan tehtäviä, joiden uskomme yleensä vaativan jonkinlaista älykkyyttä tai harkintaa, kuten kykyä tunnistaa valokuvassa olevat kohteet. Tämä saavutetaan yleensä antamalla sille runsaasti esimerkkejä siitä, millaista päättäväisyyttä koulutat verkostoa tekemään. Kuten kuvittelet, tämä vaatii sekä joukon (yleensä jäsenneltyä) dataa että kykyä saada tietokone ymmärtämään näitä tietoja. Vahvat tilastotaidot ja ohjelmointitaidot ovat välttämättömiä.
Koneoppimisen hyödylliset vaikutukset ovat käytännössä rajattomat, mutta ennen kaikkea se on kyky suorittaa monimutkaisia tai pitkiä tehtäviä nopeammin kuin kukaan ihminen koskaan pystyisi, kuten tietyn sormenjäljen tunnistaminen miljoonien kuvien arkistosta tai ristiinviittaukset. kymmeniä muuttujia tuhansissa lääketieteellisissä tiedostoissa tunnistaakseen yhdistykset, jotka voivat tarjota vihjeitä sairauden aiheuttajista. Riittävällä datalla koneoppimisen asiantuntijat voivat jopa kouluttaa hermoverkkoja tuottamaan alkuperäisiä kuvia, poimimaan merkityksellisiä oivalluksia massiivisista kirjoitetusta tekstistä, tekemään ennusteita tulevista kulutustrendeistä tai muista markkinatapahtumista ja jakamaan resursseja, jotka riippuvat erittäin monimutkaisesta jakelusta, kuten energiasta. , maksimaalisella tehokkuudella. Koneoppimisen käyttämisen etu näiden tehtävien suorittamiseen muihin automaatiomuotoihin verrattuna on, että valvomaton A.I. järjestelmä voi automaattisesti oppia ja kehittyä ajan myötä – jopa ilman uutta ohjelmointia.
Bisnesäly
Kuten aiemmasta viittauksesta markkinatapahtumiin saattoi arvata, yritys- ja rahoitusmaailma on yksi niistä paikoista, joissa koneoppiminen on tehnyt yhden varhaisimmista ja syvällisimmistä vaikutuksistaan. Saatavilla olevan valtavan numeerisen tiedon – markkinointitietokannat, kyselyt, pankkitiedot, myyntiluvut ja niin edelleen – ansiosta, joista suurin osa on hyvin organisoitua ja suhteellisen helppoa työskennellä – datatieteilijät voivat käyttää tilastoja, data-analyysejä ja Koneoppiminen poimia näkemyksiä lukemattomista yritysmaailman näkökohdista, ohjaa päätöksentekoa ja optimoi tuloksia siihen pisteeseen, että liiketoimintatiedosta on tullut tietotieteen ala.
Usein Business Intelligence -kehittäjät eivät vain katso mitä tahansa saatavilla olevaa dataa nähdäkseen, mitä he voivat löytää. he pyrkivät aktiivisesti keräämään tietoja ja kehittämään tekniikoita ja tuotteita vastatakseen tiettyihin kysymyksiin ja saavuttaakseen tiettyjä tavoitteita. Tässä mielessä Business Intelligence -kehittäjät ja analyytikot ovat elintärkeitä strategiselle kehitykselle liike-elämän ja rahoituksen maailmassa – auttaen johtajia tekemään parempia päätöksiä ja tekemään niistä nopeampia, ymmärtämään markkinoita yrityksen mahdollisuuksien ja haasteiden tunnistamiseksi sekä parantamaan yrityksen yleistä tehokkuutta. yrityksen järjestelmiin ja toimintaan, kaiken kattavana tavoitteena kilpailuedun saavuttaminen ja voittojen kasvattaminen.
Tietotekniikka
Viimeinen päätutkimusala, jolla datatieteilijät usein työskentelevät, sisältää useita erilaisia tehtäviä – tietoinsinööri, järjestelmäarkkitehti, sovellusarkkitehti, tietoarkkitehti, yritysarkkitehti tai infrastruktuuriarkkitehti, vain muutamia mainitakseni. Jokaisella näistä rooleista on omat vastuunsa, joista osa kehittää ohjelmistoja, toiset IT-järjestelmiä ja toiset yhdenmukaistavat yrityksen sisäisen rakenteen ja prosessit sen teknologian kanssa, jota se käyttää liiketoimintastrategioidensa toteuttamiseen. Heitä kaikkia yhdistää se, että tällä alalla työskentelevät datatieteilijät käyttävät dataa ja tietotekniikkaa luodakseen tai parantaakseen järjestelmiä tiettyä tehtävää silmällä pitäen.
Sovellusarkkitehti esimerkiksi tarkkailee, kuinka yritys tai muu yritys käyttää tiettyjä teknisiä ratkaisuja, ja sitten suunnittelee ja kehittää sovelluksia (mukaan lukien ohjelmistot tai IT-infrastruktuuri) suorituskyvyn parantamiseksi. Data-arkkitehti kehittää vastaavasti sovelluksia – tässä tapauksessa ratkaisuja tiedon tallentamiseen, hallintaan ja analysointiin. Infrastruktuuriarkkitehti saattaa kehittää kattavat ratkaisut, joita yritys käyttää päivittäisessä liiketoiminnassaan varmistaakseen, että ratkaisut täyttävät yrityksen järjestelmävaatimukset, olipa kyseessä offline tai pilvipalvelu. Tietosuunnittelijat puolestaan keskittyvät tietojenkäsittelyyn, suunnittelevat ja toteuttavat tietoputkia, jotka keräävät, järjestävät, tallentavat, hakevat ja käsittelevät organisaation tietoja. Toisin sanoen tämän laajan datatieteen kategorian määrittelevä piirre on se, että siinä suunnitellaan ja rakennetaan asioita: järjestelmiä, rakenteita ja prosesseja, joilla datatieteitä tehdään.
Mitkä ovat kysytyimmät datatieteen työpaikat?
Tietotiede ylipäänsä on erittäin kysytty taito, joten mahdollisuuksia löytyy valtavasti jokaiselta alan osa-alueelta ja erikoisalalta. Itse asiassa vuonna 2019 LinkedIn listasi Data Scientistin vuoden lupaavimmaksi työksi, ja QuantHub ennusti akuuttia pulaa pätevistä datatieteilijöistä tulevalle vuodelle.
Avainsana tässä on pätevä. Usein tekniset vaatimukset, jotka datatieteilijän on täytettävä, ovat niin erityisiä, että voi kestää muutaman vuoden kokemus alalla työskentelystä tarvittavan pätevyyden rakentamiseen, aloittaen yleisasiantuntijana ja lisäämällä sitten vähitellen uusia ja uusia kykyjä heidän taitovalikoimansa.
Nämä ovat vain muutamia yleisimmistä tavoista, joilla datatieteilijät voivat tehdä sen – potentiaalisia urapolkuja on yhtä monta kuin datatieteilijää, mutta joka tapauksessa uralla eteneminen riippuu uusien taitojen ja kokemusten hankkimisesta ajan myötä.
Data-analyytikko
Kuten nimestä voi päätellä, Data Analystis analysoi dataa – mutta tuo lyhyt otsikko kuvaa vain pienen osan siitä, mitä dataanalyytikot voivat saavuttaa. Ensinnäkin data alkaa harvoin helppokäyttöisessä muodossa, ja yleensä dataanalyytikot ovat vastuussa tarvittavan datan tunnistamisesta, sen keräämisestä ja kokoamisesta sekä sen puhdistamisesta ja järjestämisestä – muuntamisesta käyttökelpoiseen muotoon, määrittää, mitä tietojoukko todella sisältää, poistaa vioittuneita tietoja ja arvioida sen tarkkuutta. Sitten on itse analyysi – eri tekniikoiden avulla tarkastellaan ja mallinnetaan tietoja, etsitään malleja, poimitaan merkitys noista malleista ja ekstrapoloidaan tai mallinnetaan niitä. Lopuksi dataanalyytikot tuovat näkemyksensä muiden saataville esittämällä tiedot kojelaudassa tai tietokannassa, johon muut voivat päästä, ja välittämällä havainnoistaan muille esityksillä, kirjallisilla asiakirjoilla ja kaavioilla, kaavioilla ja muilla visualisoinneilla.
Dataanalyytikon urapolku
Data Analyst on erinomainen lähtökohta datatieteen maailmaan; se voi olla aloitustason tehtävä vaadittavasta asiantuntemustasosta riippuen. Uudet dataanalyytikot tulevat alalle tyypillisesti heti koulun jälkeen – tilastotieteen, matematiikan, tietojenkäsittelytieteen tai vastaavan tutkinnon suorittaneina – tai siirtyvät data-analyysiin liittyvään alaan, kuten liike-elämään, taloustieteeseen tai jopa yhteiskuntatieteisiin, tyypillisesti päivittämällä heidän koulutustaan. taidot uran puolivälissä data-analyysin bootcamp- tai vastaavan sertifiointiohjelman kautta.
Mutta olivatpa he äskettäin valmistuneita tai kokeneita ammattilaisia, jotka tekevät muutoksia uransa puolivälissä, uudet datatieteilijät aloittavat yleensä rutiinitehtävillä, kuten tietojen hankkimisella ja käsittelemisellä kielellä, kuten R- tai SQL-kielellä, tietokantojen rakentaminen, perusanalyysin suorittaminen ja luominen. visualisoinnit käyttämällä ohjelmia, kuten Tableau. Jokaisen data-analyytikon ei tarvitse osata tehdä kaikkia näitä asioita – erikoistumista voi tapahtua, jopa junioritehtävissä – mutta sinun pitäisi pystyä suorittamaan kaikki nämä tehtävät, jos toivot etenevän urallasi. Joustavuus on suuri etu tässä varhaisessa vaiheessa.
Miten edistyt dataanalyytikkona riippuu jossain määrin toimialasta, jolla työskentelet – esimerkiksi markkinoinnista tai rahoituksesta. Riippuen toimialasta ja tekemästäsi työstä, voit erikoistua ohjelmointiin Pythonilla tai R:llä, ryhtyä ammattilaiseksi tietojen puhdistamisessa tai keskittyä yksinomaan monimutkaisten tilastollisten mallien rakentamiseen tai kauniiden visuaalien luomiseen. toisaalta voit myös halutessasi oppia vähän kaikesta, mikä asettaa sinut johtamaan asemaa, kun otat arvonimen Senior Data Analyst. Vanhempi data-analyytikko, jolla on laaja ja riittävän syvä kokemus, on valmis ottamaan johtajan roolin ja valvomaan muiden data-analyytikkojen ryhmää, ja hänestä tulee lopulta osastopäällikkö tai johtaja. Lisätaitojen koulutuksen ansiosta dataanalyytikot ovat myös vahvassa asemassa siirtyäkseen edistyneempään Data Scientistin asemaan.
Tietojen tutkija
Varsinaiset datatieteilijät voivat tyypillisesti tehdä kaiken sen, mitä dataanalyytikot voivat tehdä, sekä muutamien muiden asioiden lisäksi – itse asiassa, oikealla koulutuksella ja kokemuksella dataanalyytikko voi lopulta edetä Data Scientistin asemaan. Joten kyllä, datatieteilijöiden pitäisi kyetä hankkimaan, puhdistamaan, käsittelemään, tallentamaan ja analysoimaan dataa – mutta myös ymmärtämään ja työskentelemään erilaisten koneoppimisen menetelmien kanssa, ja kyettävä ohjelmoimaan Pythonilla, R:llä tai vastaavalla tilastollisella ohjelmointikielellä rakentaa ja arvioida kehittyneempiä malleja.
Data Scientistin urapolku
Monet ihmiset tulevat alalle tietoanalyytikoina ennen kuin he ovat hankkineet kokemuksen ja lisätaidot, joita vaaditaan kutsuakseen itseään datatieteilijöiksi. Sitten Junior Data Scientistilta seuraava askel on tyypillisesti Senior Data Scientist – vaikka tämä yksinkertainen nimikkeen muutos vääristää siirtymiseen tarvittavan työn. Senior Data Scientist joko hallitsee ylivertaisen ymmärryksen käytännöllisesti katsoen kaikista datatieteen näkökohdista – A.I.:stä, tietovarastuksesta, tiedon louhinnasta, pilvipalveluista ja niin edelleen – sen lisäksi, että hän tuntee alakohtaisen alan, kuten liiketoimintastrategian tai terveydenhuollon analytiikan , tai he erikoistuvat jollekin näistä alueista gurutason asiantuntemuksella.
On syytä mainita, että vaikka jotkut datatieteilijät aloittavat uransa analytiikan parissa ja työskentelevät ylemmissä tehtävissä erikoisaloilla, kuten psykologiassa, markkinoinnissa, taloustieteessä ja niin edelleen, toiset aloittavat ammattilaisina jollakin näistä eri aloista ennen siirtymistä dataan. tieteellinen rooli.
Monille Senior Data Scientist on uran perimmäinen tavoite; tämä on jo niin pitkälle kehittynyt rooli, että ainakin datatieteen alalla se on usein korkein saavutettavissa oleva asema – sinusta tulee vain parempi, pätevämpi vanhempi datatieteilijä, jolla on laajemmat erikoistumisalueet. Joillekin, erityisesti niille, jotka ottavat yleisemmän lähestymistavan, on kuitenkin mahdollista edetä edelleen johtotehtäviin, kuten johtava tietotutkija, joka johtaa tiimiä tai osastoa tai jopa tietopäällikkö, joka johtaa laitoksen tietostrategiaa korkeimmalla tasolla. ja vastaa vain toimitusjohtajalle.
Tietojen insinööri
Tietosuunnittelijat erottaa muista tietoalalla työskentelevistä ammattilaisista se, että he suunnittelevat ja rakentavat kokonaisia järjestelmiä – mukaan lukien infrastruktuurin ja prosessit, joita yritys käyttää saadakseen kaiken hyödyn irti tiedosta. Tietosuunnittelijat ovat siis ihmisiä, jotka määrittävät tavat, joilla muut datatieteilijät voivat tehdä työnsä. Millaisia tietoja yrityksen järjestelmä voi vastaanottaa? Millä menetelmillä kerätään tietoa myynnistä ja markkinoinnista tai terveydenhuollon kyselyn tuloksista ja tuodaan ne analysoitavaksi? Tätä varten tietosuunnittelijoiden on tunnettava hyvin muiden datatieteen ammattilaisten – tietokantojen ylläpitäjät, tietoanalyytikot, data-arkkitehdit ja niin edelleen – tekemät työt siihen pisteeseen, että tietosuunnittelijat voivat usein suorittaa jokaista näistä rooleista hyvin. Mutta koska he ovat rakentajia, tietosuunnittelijat käyttävät yleensä enemmän aikaa kehittämiseen kuin muut datatieteen ammattilaiset – ohjelmistojen kirjoittamiseen, relaatiotietokantojen rakentamiseen tai työkalujen kehittämiseen, joiden avulla yritykset voivat jakaa tietoja osastojen välillä.
Tietotekniikan urapolku
Kuten muissakin data-alan työpaikoissa, ensimmäinen askel tietoinsinööriksi tulemiseen on usein korkeakoulututkinto (yleensä tekniikan, tietojenkäsittelytieteen tai matematiikan kandidaatin tai maisterin tutkinto) – mutta ei aina. Joku, jolla on paljon kokemusta IT- tai ohjelmistokehityksestä, saattaa huomata, että hänellä on jo kaikki tietoinsinööriksi vaadittavat taidot paitsi itse datataidot, jolloin osaa taitojen uudelleenkoulutus, kuten data bootcamp, voi auttaa saavuttamaan heidät. vauhtiin asti. Monia tietosuunnittelijan tarvitsemista taidoista (kuten SQL, UNIX ja Linux, ETL-kehitys tai IT-järjestelmien konfigurointi) voidaan kehittää työskentelemällä viereisellä alalla; toiset (kuten koneoppiminen tai dataputkien rakentaminen) vaativat tarkempaa oppimista.
Useimmat tietosuunnittelijat aloittavat kuitenkin uransa jollakin tietojenkäsittelytieteen ala-alalla ennen kuin he hankkivat kaikki nuoreksi tietoinsinööriksi vaadittavat taidot – useimmat junioritietoinsinöörien työpaikkailmoitukset vaativatkin yhdestä viiteen vuotta työkokemusta. Sieltä seuraava looginen askel on Senior Data Engineer ja Lead Data Engineer. Mutta koska he hallitsevat niin monia IT:n, ohjelmistosuunnittelun ja datatieteen näkökohtia, tietosuunnittelijoille on tarjolla myös monia muita tehtäviä – mukaan lukien tietoarkkitehti, ratkaisuarkkitehti tai sovellusarkkitehti. Henkilölle, joka haluaa tehdä vähemmän käytännön työtä ja enemmän työntekijöiden johtamista, muita vaihtoehtoja ovat tuotekehityspäällikkö – tai lopulta oikeiden ihmisten taitojen ansiosta jopa tietopäällikkö tai tietopäällikkö.
Voivatko datatieteilijät työskennellä kotoa käsin?
Kuten monet teknologia-alan työt, Data Scientist -roolit voidaan usein hoitaa etänä, mutta tämä riippuu viime kädessä yrityksestä, jossa työskentelet, ja siitä, millaista työtä teet.
Milloin datatieteilijät voivat työskennellä etänä?
Datatieteen työpaikat, jotka työskentelevät erittäin arkaluontoisten tai luottamuksellisten tietojen ja tietojen kanssa (joihin kuuluu suuri määrä niitä, jopa yksityisyyttä vaativien alojen, kuten pankki- ja terveydenhuoltoalan, ulkopuolella, koska omistusoikeudelliset tiedot voivat olla yksi suuren yrityksen arvokkaimmista omaisuuksista) kohtaavat paljon enemmän rajoituksia etätyön suhteen. Näissä tapauksissa sinun on todennäköisesti työskenneltävä toimistossa työaikana.
Muutamia muita huomioitavia tekijöitä:
Kategori: Uutiset