Публикации по теме 'data-science'


21 правило для великих программистов
Пишите код три раза. Пишите меньше кода Убедитесь, что другие поймут ваш код Участие в проектах с открытым исходным кодом Читайте много кода от других более опытных разработчиков Напишите правильную документацию Используйте средство форматирования кода Пишите комментарии в ваших запросах на извлечение Планируйте свою работу Придерживайтесь проверки кода Используйте систему контроля версий Разверните свое портфолио Создайте свой собственный блог Научите других Тренируйте..

Оценщик цен на жилье, часть 4: обработка пропущенных числовых значений — Python Machine Learning
Научитесь использовать Python в качестве специалиста по данным в этом проекте, в котором мы анализируем данные о недвижимости и прогнозируем цены на жилье. В этой серии я расскажу вам, как создать оценщик цен на жилье с помощью машинного обучения в Python.

Вы когда-нибудь задумывались, почему регрессия и дисперсионный анализ изучаются отдельно, в то время как математическая конструкция обоих…
Вы когда-нибудь задумывались, почему регрессия и дисперсионный анализ изучаются отдельно, в то время как математическая конструкция обоих выглядит одинаково? Если вышеупомянутый вопрос когда-либо возникал у вас в голове, этот блог может помочь ответить на этот вопрос. Математически ANOVA можно рассматривать как частный случай линейного регрессионного анализа, в котором все независимые переменные являются категориальными. С точки зрения применения существует большая разница между ANOVA и..

Почему я решил стать Data Scientist
Прежде всего, я думаю, что термин «наука о данных» несколько скрывает вид деятельности от ее идентичности: наука о данных существует уже сотни лет, проходя под видом «статистики». Я думаю, что науку о данных лучше определить как обучение использованию самого мощного широко доступного инструмента, который когда-либо видело человечество, — компьютера — таким образом, чтобы извлекать информацию из наборов данных пропорций, которые могут быть эффективно интерпретированы только компьютером...

Использование алгоритма - достаточно ли он для ваших прогнозов?
(Часть -1 Реализация линейной регрессии) В последнем посте я упомянул два термина Прогнозирование и Статистический вывод на простом примере. Я также упомянул, когда и почему нам может понадобиться прогнозировать будущие результаты? Мы не астрологи и не читатели карт Таро, тогда как мы можем узнать будущее. В этом вам поможет статистика. Чего ждать?? Математика ?? Статистика ?? Да !! В частности, дифференцирование, логарифмы и линейные уравнения играют ключевую роль во всех..

SQL против NoSQL - операции соединения
Практическое руководство по сравнению операций соединения в обоих SQL (язык структурированных запросов) используется для управления базами данных, в которых данные хранятся в табличной форме с помеченными строками и столбцами. NoSQL относится к разработке не-SQL или нереляционной базы данных. Он по-прежнему обеспечивает организованный способ хранения данных, но не в табличной форме. Общие структуры, адаптированные базами данных NoSQL для хранения данных, - это пары ключ-значение,..

Приложения децентрализованного обучения, часть 3 (искусственный интеллект)
Может ли децентрализованное обучение быть более надежным, чем федеративное обучение? (arXiv) Автор: Матильда Рейналь , Дарио Пасквини , Кармела Тронкосо . Аннотация: Децентрализованное обучение (DL) — это подход к взаимному обучению, который позволяет группе пользователей совместно обучать модель машинного обучения. Для обеспечения корректности DL должен быть надежным, то есть византийские пользователи не должны иметь возможности вмешиваться в результат совместной работы. В этой..