Публикации по теме 'modeling'


2 вещи, которые нужно проверить, если ваша хорошо обученная модель плохо работает с тестовыми данными
Большую часть времени при изучении науки о данных нам дается набор данных, в основном предварительно разделенный для обучения и тестирования, и мы пытаемся придумать хорошую модель с желаемой метрикой после обучения и проверки наших данных с перекрестной проверкой, тонкой настройкой. по технике и т. д. Если вы достаточно внимательны, вы хорошо разбираетесь в фиче-инжиниринге, очистке данных и т. д.; в конечном итоге вы получите хорошую модель, которая дает аналогичные результаты в реальном..

ПРАКТИКА КОМПЛЕКСНОГО МАШИННОГО ОБУЧЕНИЯ (ЭКОНОМИЧЕСКИЙ ПЕРСПЕКТИВ)
ПРАКТИКА КОМПЛЕКСНОГО МАШИННОГО ОБУЧЕНИЯ (ЭКОНОМИЧЕСКИЙ ПЕРСПЕКТИВ) Основная причина выполнения этой части работы – тщательный исследовательский анализ данных и ключевые визуализации, позволяющие получить важные сведения об аналитике и статистике в деталях. Обратите внимание, что акцент делается на пути анализа гораздо больше, чем на уровне точности. Лучше всего вы учитесь, воспроизводя модель в своей записной книжке, поэтому попробуйте воспроизвести каждый шаг анализа в своей..

Что такое ADT (алгебраические типы данных)?
У меня есть история для исследования того, может ли Цирцея полиморфно анализировать объекты Json в ADT. Один из вопросов, который я получил, был: что такое ADT? Я пробормотал пару минут, понимая, что не могу сказать конкретного объяснения того, что такое ADT. После того, как меня вызвали перед стендом, я решил, что должен понять, что такое алгебраические типы данных - и я думаю, что эти знания необходимы и часто используются во многих приложениях функционального программирования...

Google Translate Unwrapped: технология, устраняющая языковые различия
В области обработки естественного языка (НЛП) постоянно происходят изменения, но несколько лет назад все было по-другому. Было всего несколько веб-сайтов или приложений, которые могли работать с несколькими языками, и перевод в то время не имел большого значения. В этой статье мы рассмотрим функциональные возможности Google Translate, изучим его статистику и предоставим обзор его высокоуровневой архитектуры, если такая информация общедоступна. Ниже представлены основные функции;..

Финальный проект USC по машинному обучению
Блокнот Colab с Кодом Введение Этот набор данных Прогнозирование инсульта используется для прогнозирования вероятности инсульта у пациента на основе входных переменных, включая пол, возраст, различные заболевания и статус курения. Каждая строка содержит соответствующую информацию об отдельных пациентах и ​​используется для анализа следующего вопроса: Какие факторы в наибольшей степени влияют на пациентов с инсультом? Как эта информация может помочь врачам реализовать..