Как да получите първата си работа в Data Science?

Как човек може да получи първата си работа като началник на данни или анализатор на данни? Ако превъртите през форумите за научни данни, ще намерите много въпроси по тази тема. Читателите на моя блог за научни данни (data36.com) ме питат едно и също от време на време. И мога да ви кажа това напълно валиден проблем!

Реших да обобщя отговорите си за всички основни въпроси!

НОВО! Създадох обширен (безплатен) онлайн видео курс, за да ви помогна да започнете работа с Data Science. Кликнете тук за повече информация: Как да станете учен.

РЕГИСТРИРАЙТЕ ТУК (БЕЗПЛАТНО): https://data36.com/how-to-become-a-data-scientist/

# 1: Кои са най-важните умения и инструменти на учения за данни? И как можете да ги вземете?

Добра новина - лоши новини.

Ще започна с лошия. В 90% от случаите уменията, които те учат в университетите, не са много полезни в проектите за научни данни в реалния живот. Както съм писал за няколко пъти, в реални проекти са необходими тези 4 кодиращи умения:

  • bash / команден ред
  • Питон
  • SQL
  • R
  • (а понякога и Java)
източник: KDnuggets

Кои 2 или 3 ще намерите най-полезни наистина зависи от компанията ... Но ако сте научили едно, ще бъде много по-лесно да научите друго.

Така че първият голям въпрос е: как можете да получите тези инструменти? Тук идва добрата новина! Всички тези инструменти са безплатни! Това означава, че можете да ги изтеглите, инсталирате и използвате, без да плащате и стотинка за тях. Можете да практикувате, да изградите проект за хоби на данни или каквото и да е!

Наскоро написах стъпка по стъпка статия за това как да инсталирате тези инструменти на вашия компютър. Вижте тук.

# 2: Как да се науча?

Има два основни начина да научите науката за данни лесно и икономично.

1-во: Книги.

Kinda old-school, но все пак добър начин за учене. От книгите можете да получите много фокусирани, много подробни познания за онлайн анализ на данни, статистика, кодиране на данни и т.н. ... Тук подчертах 7 книги, които препоръчвам в предишната си статия.

Топ 7 книги с данни, които препоръчвам

2-ро: Онлайн уебинари и видео курсове.

Онлайн курсовете за наука за данни се предлагат с справедливи цени ($ 10 - $ 500) и обхващат различни теми, вариращи от кодиране на данни до бизнес разузнаване. Ако не искате да харчите пари за това в началото, в тази публикация изброих безплатни курсове и учебни материали.

(3-ти: Курсът на първия месец на младши учени за данни) Създадох 6-седмичен онлайн курс за научни данни за стремеж на ученият към данни да практикува и решава истински задачи на база данни за истински живот: Първият месец на Junior Data Scientist .)

# 3: Как да практикуваме и как да придобием реалния житейски опит

Това е сложно, нали? Всяка компания иска да има хора с поне малко истински житейски опит ... Но как да придобиете истински опит в живота, ако се нуждаете от истински житейски опит, за да получите първата си работа? Класически улов-22. И отговорът е: проекти за домашни любимци.

„Проект за домашни любимци“ означава, че имате идея за проект за данни, която ви вълнува. Тогава просто започвате да го изграждате. Можете да мислите за него като за малко стартиране, но не забравяйте да продължите да се фокусирате върху частта от науката за данни на проекта и можете просто да игнорирате бизнес частта. За да ви дам няколко идеи, ето някои от моите проекти за домашни любимци от последните няколко години:

  • Създадох скрипт, който следеше уебсайт за недвижими имоти и ми изпращаше по имейлите най-добрите оферти в реално време - така че можех да получа тези сделки преди всички останали.
  • Създадох сценарий, който дърпаше всички статии от ABC, BBC и CNN и въз основа на използваните думи свързах статиите, които бяха по същата тема в 3-те нови портала за новини.
  • Изградих чатбот за самообучение в Python. (Все пак не е твърде умно - тъй като още не съм го тренирал.)

Бъди креативен! Намерете проект за домашни любимци, свързан с науката за данни, и започнете да кодирате! Ако ударите стената с проблем с кодирането - това може да се случи лесно, когато започнете да научавате нов език на данните - просто използвайте google и / или stackoverflow. Един мой кратък пример - за това колко е ефективен stackoverflow:

лява страна: моят въпрос - дясна страна: отговорът (след 7 минути)

Забележете часовата марка! Изпратих един вид сложен въпрос и отговорът получих след 7 минути. Единственото нещо, което трябваше да направя, беше да копираме-поставите кода в моя производствен код и бум, той просто работи!

(Забележка: Cross Validated е друг страхотен форум за въпроси, свързани с науката за данни.)

+1 предложение:

Дори и да е малко трудно, опитайте се да получите ментор. Ако имате достатъчно късмет, ще намерите някой, който работи в ролята на Data Scientist в приятна компания и който може да прекарва 1 час седмично или две седмици с вас и да обсъжда или преподава нещата.

# 4: Къде и как изпращате първата си кандидатура за работа?

Ако не сте успели да намерите наставник, все още можете да намерите първия си в първата си компания. Това ще е първата ви работа, свързана с науката за данни, затова предлагам да не се фокусирате върху големи пари или върху супер-фантастична стартираща атмосфера. Фокусирайте се върху намирането на среда, в която можете да се научите и да се усъвършенствате.

Заемането на първата ви работа в областта на научните данни в мултинационална компания може да не се приведе в съответствие с тази идея, тъй като хората там са твърде заети с нещата си, така че няма да имат време или / и мотивация да ви помогнат да се подобрите (разбира се, винаги има изключения).

Да започнеш с мъничко стартиране като първо лице в екипа не е добра идея нито в твоя случай, защото тези компании нямат старши момчета с данни, от които да се учат.

Съветвам ви да се съсредоточите върху 50–500 компании. Това е златната среда. Старши учени по данни са на борда, но те не са твърде заети, за да ви помогнат и да ви обучат.

Добре, намерихте добри фирми ... Как да кандидатствам? Някои принципи за вашето CV: подчертайте вашите умения и проекти, а не опита си (тъй като все още нямате много години, за да поставите на хартия). Избройте съответните кодиращи езици (SQL и Python), които използвате и свържете някои от вашите свързани репозитори на github, за да можете да покажете, че наистина сте използвали този език.

Също така в повечето случаи компаниите искат мотивационно писмо. Това е добра възможност да изразите ентусиазма си, разбира се, но бихте могли да добавите и някои практически детайли, например какво бихте направили през първите си няколко седмици, ако бяхте наети. (Например „Гледайки вашия регистрационен поток, предполагам, че ____ уебстраницата играе важна роля. В първите си седмици бих извършил ___, ___ и ___ (специфични анализи), за да докажа тази хипотеза и да я разбера по-задълбочено. Това може да помогне на компанията да подобри _____ и в крайна сметка да избута _____ КПИ. “)

Надяваме се, че това ще ви даде интервю за работа, където можете да си поговорите малко за проектите на вашия домашен любимец, предложенията за мотивационно писмо, но най-вече ще става въпрос за проверка на личността и най-вероятно някакъв основен тест за умения. Ако сте тренирали достатъчно, ще преминете това ... но ако сте нервен тип и искате да практикувате повече, можете да го направите на hackerrank.com.

заключение

Е, така е. Знам, че звучи по-лесно, когато е писано, но ако наистина сте решени да бъдете Data Scientist, няма да е проблем да го направите! Късмет с това!

Ако искате да изпробвате, какво е да си младши учен с данни при стартиране на истински живот, разгледайте моя 6-седмичен онлайн курс за научни данни: Първият месец на младши учен!

И ако искате да научите повече за науката за данни, проверете моя блог (data36.com) и / или се абонирайте за моя бюлетин! И не пропускайте моята нова серия от уроци за кодиране: SQL за анализ на данни!

Благодаря за четенето!

Хареса ли ви статията? Моля, уведомете ме като щракнете върху по-долу. Освен това помага на други хора да видят историята!

Томи Местер автор на data36.com Twitter: @ data36_com