Публикации по теме 'scikit-learn'


Прогнозирование предпочтений избирателей с помощью классификатора голосования Scikitlearn
В сентябре 2021 года избиратели Калифорнии решили не вспоминать действующего губернатора Гэвина Ньюсома. В августе 2021 года опрос SurveyUSA, спонсируемый San Diego Tribune, KABC-TV Los Angeles и KGTV-TV San Diego обнаружил, что 51% вероятных избирателей проголосовали бы за , чтобы отозвать губернатора Ньюсома, в то время как 40% проголосовали бы. "Нет". После миллионов долларов, потраченных на кампании Да и Нет на то, что считалось близким к выборам. Новостные агентства..

Модели гауссовой смеси (GMM) Кластеризация в Python
Смешанная модель Гаусса ( GMM ) — это вероятностная модель , используемая для кластеризации, оценки плотности и уменьшения размерности. Это мощный алгоритм для обнаружения основных закономерностей в наборе данных. В этом руководстве мы узнаем, как реализовать кластеризацию GMM в Python с помощью библиотеки scikit-learn. Шаг 1: Импорт библиотек

Алгоритм K-ближайших соседей (KNN) для задач классификации
Теория K-ближайших соседей и реализация с помощью Scikit-Learn Ссылка на данные, использованные в этом уроке: Данные колледжа Ссылка на Полный блокнот В статистике k -алгоритм ближайшего соседа ( k -NN ) является непараметрическим Метод классификации , впервые разработанный Эвелин Фикс и Джозефом Ходжесом в 1951 году и позже расширенный Томасом Кавером . Используется для классификации и регрессии . В обоих случаях вход состоит из k ближайших обучающих..

Руководство для начинающих по разделению наборов данных машинного обучения в Python
Разделение набора данных машинного обучения на обучающие и тестовые наборы — важный шаг в процессе построения модели, поскольку он позволяет нам оценить производительность модели на невидимых данных. В этом руководстве мы узнаем, как разделить набор данных на обучающие и тестовые наборы в Python с помощью библиотеки scikit-learn. 1. Импорт библиотек и…

Распознавание рукописных цифр с помощью scikit-learn
Машинное обучение  – это развивающаяся технология, которая позволяет компьютерам автоматически учиться на основе прошлых данных. Машинное обучение использует различные алгоритмы для построения математических моделей и прогнозирования с использованием исторических данных или информации. В настоящее время он используется для различных задач, таких как распознавание изображений, распознавание речи, фильтрация электронной почты, автоматическая пометка Facebook, рекомендательная система и..

Вопросы по теме 'scikit-learn'

Проблемы масштабирования с матрицей scipy.sparse при использовании scikit
При решении проблемы машинного обучения с использованием scikit (python) мне нужно выполнить масштабирование матрицы scipy.sparse перед обучением с использованием SVM, чтобы добиться более высокой точности. Но здесь четко указано здесь , что:...
7450 просмотров
schedule 07.05.2024

KL-расхождение двух ОММ
У меня есть два GMM, которые я использовал для размещения двух разных наборов данных в одном и том же пространстве, и я хотел бы рассчитать KL-расхождение между ними. В настоящее время я использую GMM, определенные в sklearn (...
7963 просмотров
schedule 06.04.2024

Проблемы Python ScikitLearn GridSearchCV с TFIDF - JobLibValueError?
поэтому у меня есть корпус слов, на котором я запускаю TFIDF, а затем пытаюсь классифицировать с помощью логистической регрессии и GridSearch. Но я получаю огромную ошибку, когда запускаю GridSearch... ошибка такова (она длиннее, но я просто...
1221 просмотров

Как использовать параметры инициализации GradientBoostingClassifier в sklearn
Я хочу использовать один sklearn.ensemble.GradientBoostingClassifier для инициализации другого sklearn.ensemble.GradientBoostingClassifier, но возникает ошибка «IndexError: слишком много индексов для массива». Похоже, это ошибка в sklearn, а также...
787 просмотров
schedule 03.04.2024

Scikit-learn: оценка в GridSearchCV
Кажется, что GridSearchCV scikit-learn собирает оценки своих (внутренних) складок перекрестной проверки, а затем усредняет оценки всех складок. Мне было интересно, что за этим стоит. На первый взгляд может показаться более гибким вместо этого...
991 просмотров

Выведите взвешенную оценку f1 для KNeighborsClassifier
Я пытаюсь вывести только взвешенную оценку f1 для тестовых данных в KNeighborsClassifier. Я могу сделать это: neigh = KNeighborsClassifier(n_neighbors=10) neigh.fit(X_train, y_train) result = neigh.predict(X_test)...
321 просмотров
schedule 07.04.2024

Сообщение об ошибке при попытке подобрать тренировочные данные с помощью функции GridSearch
from sklearn.preprocessing import PolynomialFeatures polyreg = PolynomialFeatures(degree = 4) param_grid = {'alpha': [0.001, 0.01, 0.1, 1, 10, 100]} grid_search_polyreg = GridSearchCV(polyreg, param_grid, cv = 5) grid_search_polyreg.fit(x_train,...
287 просмотров
schedule 22.03.2024

Не удается построить кластеры K-средних для одномерных данных
Я пытаюсь внедрить алгоритм K-средних в свою задачу бинарной классификации, но не могу построить диаграмму разброса полученных двух кластеров. Мой набор данных просто в следующем виде: # size, class 312, 1 319 1 227 0...
51 просмотров