Публикации по теме 'modeling'
2 вещи, которые нужно проверить, если ваша хорошо обученная модель плохо работает с тестовыми данными
Большую часть времени при изучении науки о данных нам дается набор данных, в основном предварительно разделенный для обучения и тестирования, и мы пытаемся придумать хорошую модель с желаемой метрикой после обучения и проверки наших данных с перекрестной проверкой, тонкой настройкой. по технике и т. д. Если вы достаточно внимательны, вы хорошо разбираетесь в фиче-инжиниринге, очистке данных и т. д.; в конечном итоге вы получите хорошую модель, которая дает аналогичные результаты в реальном..
ПРАКТИКА КОМПЛЕКСНОГО МАШИННОГО ОБУЧЕНИЯ (ЭКОНОМИЧЕСКИЙ ПЕРСПЕКТИВ)
ПРАКТИКА КОМПЛЕКСНОГО МАШИННОГО ОБУЧЕНИЯ (ЭКОНОМИЧЕСКИЙ ПЕРСПЕКТИВ)
Основная причина выполнения этой части работы – тщательный исследовательский анализ данных и ключевые визуализации, позволяющие получить важные сведения об аналитике и статистике в деталях. Обратите внимание, что акцент делается на пути анализа гораздо больше, чем на уровне точности. Лучше всего вы учитесь, воспроизводя модель в своей записной книжке, поэтому попробуйте воспроизвести каждый шаг анализа в своей..
Что такое ADT (алгебраические типы данных)?
У меня есть история для исследования того, может ли Цирцея полиморфно анализировать объекты Json в ADT. Один из вопросов, который я получил, был: что такое ADT?
Я пробормотал пару минут, понимая, что не могу сказать конкретного объяснения того, что такое ADT.
После того, как меня вызвали перед стендом, я решил, что должен понять, что такое алгебраические типы данных - и я думаю, что эти знания необходимы и часто используются во многих приложениях функционального программирования...
Google Translate Unwrapped: технология, устраняющая языковые различия
В области обработки естественного языка (НЛП) постоянно происходят изменения, но несколько лет назад все было по-другому. Было всего несколько веб-сайтов или приложений, которые могли работать с несколькими языками, и перевод в то время не имел большого значения.
В этой статье мы рассмотрим функциональные возможности Google Translate, изучим его статистику и предоставим обзор его высокоуровневой архитектуры, если такая информация общедоступна.
Ниже представлены основные функции;..
Финальный проект USC по машинному обучению
Блокнот Colab с Кодом
Введение
Этот набор данных Прогнозирование инсульта используется для прогнозирования вероятности инсульта у пациента на основе входных переменных, включая пол, возраст, различные заболевания и статус курения. Каждая строка содержит соответствующую информацию об отдельных пациентах и используется для анализа следующего вопроса: Какие факторы в наибольшей степени влияют на пациентов с инсультом? Как эта информация может помочь врачам реализовать..