Сан-Паулу | Бразилия

Привет, ребята! Прежде всего, я хотел бы пояснить, что публикация этой статьи преследует две основные цели. Моя первая цель — представить специалистам по данным, которые не имеют знаний в области поведенческого анализа, потенциал этой большой области исследований, особенно когда мы говорим о разграничении исследований с одним предметом. Наука о данных и исследования больших данных в настоящее время сосредоточены на анализе тысяч данных от миллионов людей, и я считаю, что есть большой потенциал для улучшения наших методов, когда мы также начнем проводить исследования с тысячами данных от одного субъекта. Другими словами, я считаю, что в науке о данных не хватает решений, ориентированных на исследование одного предмета.

Моя вторая цель — пригласить моих друзей-психологов, особенно поведенческих аналитиков, присоединиться к этой сложной области науки о данных. Поведенческие аналитики до сих пор не знакомы с вычислительными и статистическими методами проведения поведенческих исследований. Пример этого: если вы будете искать по ключевым словам: большие данные, машинное обучение или глубокое обучение в двух крупнейших журналах по анализу поведения в мире (JABA и JEAB), вы не найдете ни одной работы (последний поиск : 12/2017).

Считаю, что такое пересечение направлений будет взаимовыгодным. Поведенческий анализ можно превратить в эффективно прагматичную науку, а наука о данных может стать более зрелой для работы с данными о поведении человека.

Большие данные уже стали реальностью!

В 2013 году я опубликовал небольшую статью, в которой обсуждались последствия интеллектуального анализа данных и искусственного интеллекта для науки о человеческом поведении (вы можете получить к ней доступ здесь — на португальском языке). В то время я был уверен в том, какое влияние этот тип технологий окажет на нашу жизнь, но не мог представить, что это произойдет так быстро.

Сейчас мы уже живем в век данных. Интернет вещей (IoT), дополненная реальность (AR), виртуальная реальность (VR), облачные вычисления, искусственный интеллект и множество других технологий ушли из фантастических фильмов и уже вошли в нашу жизнь. Мы используем все эти технологии, и они доступны по низкой цене. В любом случае, в настоящее время все, что мы делаем, уже можно смоделировать с помощью двух цифр: 0 и 1. Вот что мы имеем в виду, когда говорим, что находимся в цифровом мире.

Наверняка вы, возможно, слышали, что все эти технологии производят объем данных, невиданный ранее в истории человечества. Возможно, вы также слышали о больших данных и науке о данных. Только в 2013 году мы произвели в Интернете больше информации, чем за все предыдущие годы вместе взятые (у меня нет обновленных данных об этом, но я считаю, что сегодня (2017 год) число должно быть намного выше.
Прежде чем вы можете подумать, что Большие данные только помогут отраслевому маркетингу продать вам больше продуктов. Я привожу небольшой список того, что большие данные могут сделать для мира в самом ближайшем будущем:

  • Лечение и предотвращение рака: более точная диагностика, визуализация, анализ гигантских медицинских карт, чтобы найти наиболее подходящее лечение для пациента.
  • Искоренить голод в мире: большая дата может изменить способ производства продуктов питания, устранив отходы, предложив новые методы распределения
  • Прогнозировать, чтобы предупредить о стихийных бедствиях. Системы прогнозирования могут предупреждать зоны риска за несколько недель до определенных типов стихийных бедствий.
  • Улучшенная безопасность, благодаря анализу данных компьютерного зрения, камеры безопасности могут выявлять случаи предполагаемого преступного поведения и принимать меры.
  • Обучать детей с ограниченными интеллектуальными возможностями. Алгоритмы прогнозирования могут создавать персонализированные программы обучения, которые лучше адаптированы к индивидуальному репертуару любого человека.

Я попытаюсь достичь своей цели — показать специалистам по данным и поведенческим аналитикам важность совместной работы, выделив точки, где мы все еще «ползаем» на пересечении этих областей. Это всего лишь примеры того, как пересечение этих дисциплин может привести к методологическим и техническим достижениям в обеих областях. Я верю, что в будущем работа исследователей на этих пересечениях может привести к появлению невиданных ранее технологий.

Некоторые причины…

Психологи, особенно поведенческие аналитики, знают о сложности науки, которую мы называем «поведенческим анализом». Как исследователи-экспериментаторы они привыкли иметь дело со сложностью и множественной детерминированностью поведения. Они знают несколько факторов и переменных, определяющих одно и то же поведение. Они также знают, что предстоит еще много работы и что есть много переменных, о которых мы до сих пор не знаем. Самое главное, они могут видеть детализацию, связанную с определением поведения, и то, что во многих контекстах это может привести к анализу сотен тысяч данных. Однако большинство этих исследователей до сих пор не знают, что такое «большие данные» и какой вклад они могут внести в изучение человеческого поведения. Как я уже говорил, сегодня все еще редко можно найти поведенческих аналитиков, знакомых с инструментами, которые могли бы автоматизировать и расширить возможности их работы по поведенческому анализу. Большую часть выполняемой ими ручной работы могли бы выполнять роботы, а их исследования можно было бы сделать гораздо более точными.

Через перекресток работают инженеры-программисты и инженеры-статистики, специализирующиеся на больших данных. Эта вторая группа относится к области информационных технологий, информационного моделирования и статистики. Тем не менее, все еще существует определенное ограничение в ограничении исследований больших данных и человеческого поведения, сравнении отдельных лиц с однородными группами.

Поищите в Google «Большие данные и поведение человека». Скорее всего, почти весь материал, который вы найдете, будет связан с групповыми исследованиями по выявлению закономерностей.

Моя личная гипотеза состоит в том, что это потому, что это наиболее легко сделать с экономической точки зрения. Соотношение затрат и выгод в этом сценарии очень ясно. Дело в том, что можно многое сказать о популяции, просто взглянув на выборку, но нельзя сказать все.

Самое главное, есть вопросы, на которые вы сможете ответить, только если сравните поведение индивидуума с его собственным, а также сравните его с поведением групп.

В отличие от традиционных статистических моделей, в которых мы склонны рассматривать десятки тысяч данных от групп людей, чтобы предсказать поведение человека, психологи-бихевиористы обычно анализируют поведение одного человека.
Я не говорю, что сравнение людей в традиционный способ - это проблема, я говорю, что мы это сделали, потому что мы были ограничены, сегодня у нас есть технологии для проведения уровня индивидуального поведения.

Прогнозирование и объяснение причин человеческого поведения — это связанные действия, но это не одно и то же. Мы можем предсказать, что ребенок выучит тему x математики быстрее, если он выучит до y, глядя на то, как учились тысячи детей с такими же характеристиками, но мы не можем сказать, что ребенок выучил тему x быстрее, просто глядя на этот факт. . Чтобы действительно объяснить, почему конкретный ребенок выучил y после того, как выучил y, нам нужно взглянуть на поведенческие многомерности поведения этого отдельного человека. Это дорогостоящая процедура, и ее довольно сложно выполнить неспециалистам. Результаты этого типа исследований, хотя и ценные, не служат интересам рынка, поэтому в этот тип подхода в поведенческих исследованиях вложено мало средств.

Безусловно, наиболее важным моментом, в котором поведенческие аналитики могут помочь специалистам по данным в поведенческих исследованиях, является понимание человеческого поведения как динамической переменной, а не как статического атрибута.

Если вы не изучаете эту область, вы, вероятно, не знаете, что все научные подходы в области психологии происходят от одной из двух великих школ: структуралистской школы и функционалистской школы. Объяснение различий между обоими подходами выходит за рамки этого текста, но только в образовательных целях важно, чтобы вы понимали, что методы исследования в психологии, основанные на функционалистском подходе, имеют тенденцию быть более эмпирическими и близкими к естественным. наук (в отличие от структуралистских подходов, которые имеют дело с человеческим разумом как структурой (например, психоанализ Фрейда и аналитическая психология Юнга). Анализ поведения, основанный Б. Ф. Скиннером, представляет собой подход к психологии, на который сильно повлиял функционализм. Поведенческие аналитики — это психологи. Кто работает с этим подходом.

Б. Ф. Скиннер был исследователем из Гарварда и одним из самых важных и влиятельных психологов всех времен. Без сомнения, самым важным вкладом Скиннера в науку была концепция оперантного поведения. По иронии судьбы, это также самая трудная для понимания концепция из всей скиннеровской теории, потому что она переворачивает понятие причинности человеческого поведения.
Когда мы говорим о человеческом поведении, очень часто думают, что то, что определяет или влияет на вероятность появления определяющего поведения — это то, что происходит до поведения, а не после. Другими словами, последствие.
Последствие (технический термин, обозначающий все, что происходит после возникновения определенного поведения) может повлиять на будущую вероятность повторения этого конкретного поведения. Форма, интенсивность и другие атрибуты, определяющие влияние вероятности, изучались психологами-бихевиористами. Если вы не знакомы с этой темой, настоятельно рекомендую прочитать эту книгу: Ссылка на amazon.
Я часто читаю статьи блестящих статистиков и компьютерных ученых, которые категорически терпят неудачу в этом вопросе, то есть допускают элементарные ошибки. в интерпретации данных, связанных с детерминацией человеческого поведения. Я их не виню, это было бы то же самое, что требовать от психологов умения производить сложные математические расчеты. Я просто утверждаю, что хорошие специалисты по данным должны минимально понимать человеческое поведение, если они хотят выполнять более последовательный и точный анализ, особенно если их задача состоит в том, чтобы объяснить конкретную переменную, связанную с человеческим поведением, а не просто предсказать ее.

В заключение я возвращаюсь к следующему пункту: предсказание и объяснение человеческого поведения — очень разные задачи. По моему мнению, очень скоро приложения, связанные с наукой о данных и человеческим поведением, потребуют гораздо большего, чем предсказание конкретного поведения, они должны будут понять их, а затем разумно действовать перед ними. Когда это произойдет, я считаю, что мы получим две большие выгоды для науки: (1) в области психологии у нас будет гораздо более широкое знание переменных, связанных с приобретением человеческого поведения (2) в области науки о данных, которую мы будет иметь гораздо более интеллектуальные, способные приложения сложных задач. Я считаю, что для того, чтобы это стало возможным, психологи и специалисты по данным уже могут начать совместную работу, чтобы совершить прорыв в обеих науках.