Публикации по теме 'data-science'
21 правило для великих программистов
Пишите код три раза. Пишите меньше кода Убедитесь, что другие поймут ваш код Участие в проектах с открытым исходным кодом Читайте много кода от других более опытных разработчиков Напишите правильную документацию Используйте средство форматирования кода Пишите комментарии в ваших запросах на извлечение Планируйте свою работу Придерживайтесь проверки кода Используйте систему контроля версий Разверните свое портфолио Создайте свой собственный блог Научите других Тренируйте..
Оценщик цен на жилье, часть 4: обработка пропущенных числовых значений — Python Machine Learning
Научитесь использовать Python в качестве специалиста по данным в этом проекте, в котором мы анализируем данные о недвижимости и прогнозируем цены на жилье.
В этой серии я расскажу вам, как создать оценщик цен на жилье с помощью машинного обучения в Python.
Вы когда-нибудь задумывались, почему регрессия и дисперсионный анализ изучаются отдельно, в то время как математическая конструкция обоих…
Вы когда-нибудь задумывались, почему регрессия и дисперсионный анализ изучаются отдельно, в то время как математическая конструкция обоих выглядит одинаково?
Если вышеупомянутый вопрос когда-либо возникал у вас в голове, этот блог может помочь ответить на этот вопрос. Математически ANOVA можно рассматривать как частный случай линейного регрессионного анализа, в котором все независимые переменные являются категориальными.
С точки зрения применения существует большая разница между ANOVA и..
Почему я решил стать Data Scientist
Прежде всего, я думаю, что термин «наука о данных» несколько скрывает вид деятельности от ее идентичности: наука о данных существует уже сотни лет, проходя под видом «статистики». Я думаю, что науку о данных лучше определить как обучение использованию самого мощного широко доступного инструмента, который когда-либо видело человечество, — компьютера — таким образом, чтобы извлекать информацию из наборов данных пропорций, которые могут быть эффективно интерпретированы только компьютером...
Использование алгоритма - достаточно ли он для ваших прогнозов?
(Часть -1 Реализация линейной регрессии)
В последнем посте я упомянул два термина Прогнозирование и Статистический вывод на простом примере. Я также упомянул, когда и почему нам может понадобиться прогнозировать будущие результаты? Мы не астрологи и не читатели карт Таро, тогда как мы можем узнать будущее. В этом вам поможет статистика. Чего ждать?? Математика ?? Статистика ?? Да !! В частности, дифференцирование, логарифмы и линейные уравнения играют ключевую роль во всех..
SQL против NoSQL - операции соединения
Практическое руководство по сравнению операций соединения в обоих
SQL (язык структурированных запросов) используется для управления базами данных, в которых данные хранятся в табличной форме с помеченными строками и столбцами. NoSQL относится к разработке не-SQL или нереляционной базы данных. Он по-прежнему обеспечивает организованный способ хранения данных, но не в табличной форме.
Общие структуры, адаптированные базами данных NoSQL для хранения данных, - это пары ключ-значение,..
Приложения децентрализованного обучения, часть 3 (искусственный интеллект)
Может ли децентрализованное обучение быть более надежным, чем федеративное обучение? (arXiv)
Автор: Матильда Рейналь , Дарио Пасквини , Кармела Тронкосо .
Аннотация: Децентрализованное обучение (DL) — это подход к взаимному обучению, который позволяет группе пользователей совместно обучать модель машинного обучения. Для обеспечения корректности DL должен быть надежным, то есть византийские пользователи не должны иметь возможности вмешиваться в результат совместной работы. В этой..