Почему я решил сменить профессию на науку о данных? Думаю, причин может быть много, но что на самом деле заставило меня прийти к этому? У меня всегда был природный талант к математике и решению головоломок, и я получаю от этого огромное удовольствие, но что меня действительно привлекало, так это бесконечные возможности творчества с помощью алгоритмов науки о данных и машинного обучения.

«Если бы ты только мог видеть то, что я видел твоими глазами»

Несколько лет назад я был в музее Уитни на первом свидании с женщиной, которая теперь является моей женой, и я наткнулся на произведение искусства, которое полностью меня затянуло. Название работы было Бегущий по лезвию лезвия, автокодирование Терренса Броуда, и хотя на первый взгляд это был просто монитор, играющий в Бегущего по лезвию, это не так. На самом деле это был алгоритм машинного обучения, а именно автоэнкодер, который был обучен всему фильму Бегущий по лезвию и воспроизводился из памяти своего обучения. Я был потрясен его метафизическими последствиями. Что на самом деле помнил алгоритм? Чем на самом деле была компьютерная память, если она могла быть чем-то большим, чем просто воспроизведение видеофайла? Позже и после некоторых исследований я наткнулся на веб-страницу художника вместе с кодом для автоэнкодера. У меня был некоторый опыт создания веб-сайтов на javascript и других распространенных компьютерных языках, но я не мог понять, что происходит в коде, и хотел знать об этом все.

Спустя годы, после долгих исследований и просмотра бесчисленных видеороликов на Youtube, объясняющих математику, лежащую в основе машинного обучения и нейронных сетей, я решил подать заявку на учебный курс по науке о данных. Я хотел изучать науку о данных в профессиональной среде, но меня очень интересуют возможности того, что можно создать с помощью машинного обучения. В частности, поскольку в тот день я увидел Blade Runner Autoencoded, мне было интересно, какие новые медиа я могу создать с помощью моделей и нейронных сетей. Тем не менее, я жаждал узнать больше.

Поэтому я искал смену карьеры

Перед подачей заявления в школу Flatiron у меня уже было много ожиданий от интернета и друзей, но я понятия не имел, как все будет на самом деле. Я разговаривал с друзьями и выпускниками, которые закончили различные курсы в той же школе, и я собрал много их мнений и советов о том, чего ожидать в течение этих трех месяцев. Я бесчисленное количество раз гуглил, чтобы посмотреть, чем люди поделились в Интернете со времени своего пребывания в буткемпе. Я многое узнал о лучшем и худшем из того, чем люди поделились из своего опыта.

У меня было шесть месяцев с момента моего поступления, чтобы подготовиться к курсу, и я хотел быть настолько готовым, насколько это возможно, чтобы узнать еще больше во время посещения буткемпа. Я провел большую часть этих шести месяцев, изучая все, что попадалось мне на глаза, чтобы сгладить любые трудности обучения.

Расскажу немного о своем профессиональном опыте. Я закончил колледж со степенью бакалавра искусств в Studio Art. Я работаю графическим дизайнером и художником около 10 лет и уже немного знаю код. Хотя у меня нет традиционного опыта программирования, я брал уроки C++ и за эти годы научился разрабатывать веб-сайты. Когда я подал заявку на буткемп, я почти ничего не знал о написании реального кода для Data Science.

Для начала я изучил Python

Я выучил Python на SoloLearn.

SoloLearn — отличное приложение, в котором интересно учиться. У них есть разные модули для изучения множества различных концепций в DataScience и кодировании, совершенно бесплатно. Это что-то вроде Duolingo для программирования.

Я легко закончил первый курс Python за выходные и провел следующие несколько недель, работая над продвинутыми модулями Python, а также всем, что связано с наукой о данных (машинное обучение и т. д.).

Потом я нашел Kaggle.

Когда я узнал о Kaggle, я был совершенно поражен и сразу же зацепился. У Kaggle есть потрясающие ресурсы для обучения и множество высококачественных наборов данных, с которыми можно поиграть. Существует множество курсов для изучения основ машинного обучения.

В дополнение к отличным учебным ресурсам, соревнования на Kaggle предлагают кладезь учебных материалов. Существуют не только тренировочные соревнования (такие как популярный Titanic Dataset) с простыми в использовании курсами и учебниками, размещенными пользователями, но и одно из величайших обучающих сообществ, с которыми я когда-либо сталкивался. Благодаря тому, что многие люди делятся своим анализом и кодом для каждой проблемы, любой, кто участвует в конкурсе, получает потрясающие отзывы и различные точки зрения от активного сообщества кодеров, аналитиков и инженеров.

Затем мне нужно было охватить всю математику, связанную с глубоким обучением.

У меня не было опыта в области вероятностей, статистики или линейной алгебры, и мне нужно было освежить знания в области исчисления, поэтому я одолжил электронные книги по каждой теме из моей местной библиотеки на Libby.

Затем я обнаружил видео MIT OpenCourseware на Youtube. Одну неделю за другой я целыми днями смотрел лекции по математике. На сегодняшний день лучшим курсом для понимания основных концепций машинного обучения и нейронных сетей была Линейная алгебра, которую преподавал Гилберт Стрэнг. Эти уроки были сняты где-то в 1990-х годах, но Стрэнг — находчивый учитель и всегда усердно показывает примеры от руки на доске. В дополнение к двум курсам линейной алгебры, которые вел Стрэнг, я смотрел видео-плейлисты по исчислению, вероятности, информатике и алгоритмам.

Ближе к концу подготовки к буткемпу я отрепетировал массу задач на собеседовании на Leetcode. Было много задач, связанных с вопросами, изложенными во Введении в алгоритмы Массачусетского технологического института, которые я мог практиковать на основе того, что узнал на этих лекциях.

Последний месяц перед буткемпом я потратил на изучение Tensorflow и создание ванильных примеров известных нейросетевых моделей. Я создал GAN (генеративно-состязательную сеть) с ручным циклом и чат-бот Transformer с механизмом Attention. Я даже создал автоэнкодер, подобный тому, что был в Бегущем по лезвию лезвия с автокодированием, который я видел много лет назад в музее Уитни. Оглядываясь назад на код обложки, я чувствовал, что понял его или, по крайней мере, немного больше, чем ничего. Я также понял, как тяжелая работа изобретателей и программистов по всему миру, которые открыли алгоритмы, используемые во всех этих и многих других моделях — во всех творениях машинного обучения в Интернете и на компьютерах по всему миру — создала разнообразное сообщество специалистов по данным. .

Все только начинается

Сейчас я собираюсь закончить первую фазу 5 в буткемпе Data Science в школе Flatiron. Я могу сказать, что это так же сложно, как я и ожидал, но я чувствую себя хорошо подготовленным благодаря всем потрясающим бесплатным ресурсам, доступным в Интернете, и я горю желанием продолжить эту новую карьеру постоянного обучения и исследований. Более того, я рад создавать искусство, музыку и новые медиа с помощью моделей машинного обучения и глубокого обучения, а также делиться своими исследованиями с сообществом открытого исходного кода.