Paano makuha ang iyong unang trabaho sa Data Science?

Paano makakakuha ng kanyang unang trabaho sa antas ng pagpasok bilang isang Data Scientist o isang Data Analyst? Kung mag-scroll ka sa mga forum ng agham ng data, maraming mga katanungan ang makikita mo sa paksang ito. Ang mga mambabasa ng aking blog blog science (data36.com) ay nagtanong sa akin pareho sa oras-oras. At maaari kong sabihin sa iyo ito ng isang ganap na wastong problema!

Nagpasya akong buod ng aking mga sagot para sa lahat ng mga pangunahing katanungan!

BAGONG! Gumawa ako ng isang komprehensibong (libre) online na kurso ng video upang matulungan kang magsimula sa Data Science. Mag-click dito para sa karagdagang impormasyon: Paano Maging isang Data Scientist.

MAGDAFITA DITO (PARA SA LIBRE): https://data36.com/how-to-become-a-data-scientist/

# 1: Ano ang pinakamahalagang kasanayan sa mga kasanayan sa siyentipiko at tool? At paano mo makuha ang mga ito?

Magandang balita - masamang balita.

Magsisimula ako sa masama. Sa 90% ng mga kaso, ang mga kasanayan na itinuturo nila sa iyo sa mga unibersidad ay hindi talagang kapaki-pakinabang sa mga proyekto ng data sa agham ng buhay. Tulad ng aking isinulat tungkol sa maraming beses, sa mga tunay na proyekto ang mga 4 na kasanayan sa coding ng data ay kinakailangan:

  • linya ng bash / utos
  • Python
  • SQL
  • R
  • (at kung minsan Java)
mapagkukunan: KDnuggets

Aling 2 o 3 mahahanap mo ang pinaka kapaki-pakinabang na talagang nakasalalay sa kumpanya ... Ngunit kung nalaman mo ang isa, mas madali itong matuto ng isa pa.

Kaya ang unang malaking katanungan ay: paano mo makukuha ang mga tool na ito? Narito ang magandang balita! Ang lahat ng mga tool na ito ay libre! Nangangahulugan ito na maaari mong i-download, mai-install at gamitin ang mga ito nang hindi nagbabayad ng isang sentimo para sa kanila. Maaari kang magsanay, bumuo ng isang proyekto ng hobby ng data o anumang bagay!

Sumulat ako ng isang sunud-sunod na artikulo kamakailan sa kung paano i-install ang mga tool na ito sa iyong computer. Tingnan ito dito.

# 2: Paano matutunan?

Mayroong 2 pangunahing paraan upang matuto nang madali ang agham ng data at mahusay.

Ika-1: Mga Aklat.

Kinda old-school, ngunit isang mahusay na paraan ng pag-aaral. Mula sa mga libro maaari kang makakuha ng lubos na nakatuon, napaka detalyadong kaalaman tungkol sa pagtatasa ng online data, statistic, data coding, atbp..

Nangungunang 7 mga libro ng data na inirerekumenda ko

Ika-2: Mga online webinars at mga kurso sa video.

Ang mga kurso sa online science data ay darating na may mga patas na presyo ($ 10- $ 500) at saklaw nila ang iba't ibang mga paksa mula sa data coding hanggang sa intelihensiyang negosyo. Kung hindi mo nais na gumastos ng pera sa simula pa lamang, nakalista ako ng mga libreng kurso at mga materyales sa pag-aaral sa post na ito.

. .)

# 3: Paano pagsasanay, at kung paano makakuha ng totoong karanasan sa buhay

Ito ay isang nakakalito, di ba? Ang bawat kumpanya ay nagnanais na magkaroon ng mga taong may hindi bababa sa kaunting tunay na karanasan sa buhay ... Ngunit paano ka makakakuha ng totoong karanasan sa buhay, kung kailangan mo ng totoong karanasan sa buhay upang makuha ang iyong unang trabaho? Klasikong catch-22. At ang sagot ay: mga proyekto ng alagang hayop.

"Ang proyekto ng alagang hayop" ay nangangahulugang nagtagpo ka ng isang ideya sa proyekto ng data na nagpapasaya sa iyo. Pagkatapos ay simulan mo lamang itong itayo. Maaari mong isipin ang tungkol dito bilang isang maliit na pagsisimula, ngunit tiyaking patuloy mong nakatuon sa bahagi ng agham ng data ng proyekto at maaari mo lamang balewalain ang bahagi ng negosyo. Upang mabigyan ka ng ilang mga ideya, narito ang ilan sa aking mga proyekto sa alagang hayop mula sa nakaraang ilang taon:

  • Nagtayo ako ng isang script na sinusubaybayan ang isang website ng real estate at na-email sa akin ang pinakamahusay na deal sa real time - kaya makakakuha ako ng mga deal sa harap ng lahat.
  • Nagtayo ako ng isang script na kumukuha ng lahat ng mga artikulo na form ng ABC, BBC at CNN at, batay sa mga salitang ginamit, nakakonekta ang mga artikulo na tungkol sa eksaktong parehong paksa sa 3 iba't ibang mga portal ng balita.
  • Nagtayo ako ng isang self-learning chatbot sa Python. (Ito ay hindi masyadong matalino bagaman - bilang hindi ko pa nasasanay ito.)

Maging malikhain! Maghanap ng isang proyekto ng alagang hayop na may kaugnayan sa agham para sa iyong sarili at simulan ang pag-cod! Kung pinindot mo ang pader na may isang problema sa pag-coding - madali itong mangyari, kapag nagsimula kang malaman ang isang bagong wika ng data - gumamit lamang ng google at / o stackoverflow. Isang maikling halimbawa ng minahan - kung gaano kabisa ang mabubuong stackoverflow:

kaliwang bahagi: ang aking tanong - kanang bahagi: ang sagot (sa 7 minuto)

Pansinin ang timestamp! Nagpadala ako sa isang uri ng kumplikadong katanungan at nakuha ko ang sagot sa loob ng 7 minuto. Ang kailangan ko lang gawin ay kopyahin-paste ang code sa aking production code at boom, nagtrabaho lang ito!

(Tandaan: Ang Cross Validated ay isa pang mahusay na forum para sa mga katanungan na may kaugnayan sa Data Science.)

+1 mungkahi:

Kahit na medyo mahirap, subukang makakuha ng isang mentor. Kung ikaw ay sapat na masuwerteng, makakahanap ka ng isang taong nagtatrabaho sa isang papel ng Scient Scientist sa isang magandang kumpanya at maaaring gumastos ng 1 oras lingguhan o biweekly sa iyo at talakayin o magturo ng mga bagay.

# 4: Saan at paano mo ipadala ang iyong unang aplikasyon sa trabaho?

Kung hindi ka pa nakakapaghanap ng isang mentor, maaari mo pa ring mahanap ang iyong una sa iyong unang kumpanya. Ito ay magiging iyong unang data na may kaugnayan sa agham ng data, kaya iminumungkahi ko na hindi nakatuon sa malaking pera o sa isang sobrang nakakaaliw na kapaligiran. Tumutok sa paghahanap ng isang kapaligiran kung saan maaari mong malaman at pagbutihin ang iyong sarili.

Ang pagkuha ng iyong unang trabaho sa agham ng data sa isang multinational na kumpanya ay maaaring hindi magkahanay sa ideyang ito, dahil ang mga tao doon ay karaniwang masyadong abala sa kanilang mga bagay, kaya hindi sila magkakaroon ng oras o / at pagganyak upang matulungan kang pagbutihin (siyempre, palaging mayroong pagbubukod).

Simula sa isang maliit na pag-uumpisa bilang isang unang tao ng data sa koponan ay hindi isang magandang ideya alinman sa iyong kaso, dahil ang mga kumpanyang ito ay walang mga senior data guys upang malaman mula sa.

Ipinapayo ko sa iyo na tumuon sa 50-500 sized na kumpanya. Iyon ang gintong ibig sabihin. Ang mga senior data na siyentipiko ay nakasakay, ngunit hindi sila masyadong abala upang matulungan at turuan ka.

Okay, nakahanap ka ng ilang magagandang kumpanya ... Paano mag-apply? Ang ilang mga prinsipyo para sa iyong CV: i-highlight ang iyong mga kasanayan at proyekto, hindi ang iyong karanasan (dahil wala kang masyadong maraming taon upang ilagay sa papel). Ilista ang mga kaugnay na wika sa pag-coding (SQL at Python), ginagamit mo, at i-link ang ilan sa iyong mga kaugnay na github repos, upang maipakita mo na ginamit mo talaga ang wikang iyon.

Gayundin, sa karamihan ng mga kaso, ang mga kumpanya ay humihiling ng isang takip ng sulat. Ito ay isang magandang pagkakataon upang maipahayag ang iyong sigasig, siyempre, ngunit maaari kang magdagdag ng ilang mga praktikal na mga detalye pati na rin, tulad ng kung ano ang gagawin mo sa iyong unang ilang linggo kung ikaw ay inuupahan. . Makakatulong ito sa kumpanya upang mapagbuti ang _____ at kalaunan ay itulak ang mga _____ KPI. ")

Inaasahan na mapunta ito sa iyo ng isang pakikipanayam sa trabaho, kung saan maaari kang mag-chat nang kaunti tungkol sa iyong mga proyekto sa alagang hayop, ang iyong mga suhestiyon sa takip ng takip, ngunit halos lahat ay tungkol sa pagkakasuri sa pagkatao at marahil marahil ilang pangunahing mga kasanayan sa pagsubok. Kung sapat na ang iyong pagsasanay, ipapasa mo ito ... ngunit kung ikaw ay isang uri ng nerbiyos at nais mong magsagawa ng higit pa, magagawa mo ito sa hackerrank.com.

Konklusyon

Kumbaga, ito na. Alam kong mas madali itong tunog kapag nakasulat ito, ngunit kung talagang tinutukoy mong maging isang Data Scientist, hindi ito magiging anumang problema upang mangyari ito! Buti na lang kasama yan!

Kung nais mong subukan, kung ano ito ay tulad ng pagiging isang siyentipiko ng junior data sa isang tunay na buhay na pagsisimula, tingnan ang aking 6-linggong kurso sa agham ng data sa online: Ang Unang Buwan ng Junior Data Scientist!

At kung nais mong malaman ang higit pa tungkol sa agham ng data, suriin ang aking blog (data36.com) at / o mag-subscribe sa aking Newsletter! At huwag palalampasin ang aking bagong serye ng coding tutorial: SQL para sa Pagsusuri ng Data!

Salamat sa pagbabasa!

Tatangkilikin ang artikulo? Mangyaring ipaalam lamang sa akin sa pamamagitan ng pag-click sa sa ibaba. Nakakatulong din ito sa ibang mga tao na makita ang kuwento!

Tomi Mester may-akda ng data36.com Twitter: @ data36_com