Статьи по теме scikit-learn

Публикации по теме 'scikit-learn'

Прогнозирование предпочтений избирателей с помощью классификатора голосования Scikitlearn

В сентябре 2021 года избиратели Калифорнии решили не вспоминать действующего губернатора Гэвина Ньюсома. В августе 2021 года опрос SurveyUSA, спонсируемый San Diego Tribune, KABC-TV Los Angeles и KGTV-TV San Diego обнаружил, что 51% вероятных избирателей проголосовали бы за , чтобы отозвать губернатора Ньюсома, в то время как 40% проголосовали бы. "Нет". После миллионов долларов, потраченных на кампании Да и Нет на то, что считалось близким к выборам. Новостные агентства..

Модели гауссовой смеси (GMM) Кластеризация в Python

Смешанная модель Гаусса ( GMM ) — это вероятностная модель , используемая для кластеризации, оценки плотности и уменьшения размерности. Это мощный алгоритм для обнаружения основных закономерностей в наборе данных. В этом руководстве мы узнаем, как реализовать кластеризацию GMM в Python с помощью библиотеки scikit-learn. Шаг 1: Импорт библиотек

Алгоритм K-ближайших соседей (KNN) для задач классификации

Теория K-ближайших соседей и реализация с помощью Scikit-Learn Ссылка на данные, использованные в этом уроке: Данные колледжа Ссылка на Полный блокнот В статистике k -алгоритм ближайшего соседа ( k -NN ) является непараметрическим Метод классификации , впервые разработанный Эвелин Фикс и Джозефом Ходжесом в 1951 году и позже расширенный Томасом Кавером . Используется для классификации и регрессии . В обоих случаях вход состоит из k ближайших обучающих..

Руководство для начинающих по разделению наборов данных машинного обучения в Python

Разделение набора данных машинного обучения на обучающие и тестовые наборы — важный шаг в процессе построения модели, поскольку он позволяет нам оценить производительность модели на невидимых данных. В этом руководстве мы узнаем, как разделить набор данных на обучающие и тестовые наборы в Python с помощью библиотеки scikit-learn. 1. Импорт библиотек и…

Распознавание рукописных цифр с помощью scikit-learn

Машинное обучение – это развивающаяся технология, которая позволяет компьютерам автоматически учиться на основе прошлых данных. Машинное обучение использует различные алгоритмы для построения математических моделей и прогнозирования с использованием исторических данных или информации. В настоящее время он используется для различных задач, таких как распознавание изображений, распознавание речи, фильтрация электронной почты, автоматическая пометка Facebook, рекомендательная система и..

Вопросы по теме 'scikit-learn'

Проблемы масштабирования с матрицей scipy.sparse при использовании scikit

При решении проблемы машинного обучения с использованием scikit (python) мне нужно выполнить масштабирование матрицы scipy.sparse перед обучением с использованием SVM, чтобы добиться более высокой точности. Но здесь четко указано здесь , что:...

7450 просмотров

python machine-learning scikit-learn

07.05.2024

KL-расхождение двух ОММ

У меня есть два GMM, которые я использовал для размещения двух разных наборов данных в одном и том же пространстве, и я хотел бы рассчитать KL-расхождение между ними. В настоящее время я использую GMM, определенные в sklearn (...

7963 просмотров

python numpy scipy scikit-learn statistics

06.04.2024

Проблемы Python ScikitLearn GridSearchCV с TFIDF - JobLibValueError?

поэтому у меня есть корпус слов, на котором я запускаю TFIDF, а затем пытаюсь классифицировать с помощью логистической регрессии и GridSearch. Но я получаю огромную ошибку, когда запускаю GridSearch... ошибка такова (она длиннее, но я просто...

1221 просмотров

python numpy scikit-learn tf-idf grid-search

23.03.2024

Как использовать параметры инициализации GradientBoostingClassifier в sklearn

Я хочу использовать один sklearn.ensemble.GradientBoostingClassifier для инициализации другого sklearn.ensemble.GradientBoostingClassifier, но возникает ошибка «IndexError: слишком много индексов для массива». Похоже, это ошибка в sklearn, а также...

787 просмотров

python scikit-learn

03.04.2024

Scikit-learn: оценка в GridSearchCV

Кажется, что GridSearchCV scikit-learn собирает оценки своих (внутренних) складок перекрестной проверки, а затем усредняет оценки всех складок. Мне было интересно, что за этим стоит. На первый взгляд может показаться более гибким вместо этого...

991 просмотров

machine-learning optimization scikit-learn cross-validation

13.04.2024

Выведите взвешенную оценку f1 для KNeighborsClassifier

Я пытаюсь вывести только взвешенную оценку f1 для тестовых данных в KNeighborsClassifier. Я могу сделать это: neigh = KNeighborsClassifier(n_neighbors=10) neigh.fit(X_train, y_train) result = neigh.predict(X_test)...

321 просмотров

python-3.x data-science scikit-learn

07.04.2024

Сообщение об ошибке при попытке подобрать тренировочные данные с помощью функции GridSearch

from sklearn.preprocessing import PolynomialFeatures polyreg = PolynomialFeatures(degree = 4) param_grid = {'alpha': [0.001, 0.01, 0.1, 1, 10, 100]} grid_search_polyreg = GridSearchCV(polyreg, param_grid, cv = 5) grid_search_polyreg.fit(x_train,...

287 просмотров

python-3.x scikit-learn grid-search

22.03.2024

Не удается построить кластеры K-средних для одномерных данных

Я пытаюсь внедрить алгоритм K-средних в свою задачу бинарной классификации, но не могу построить диаграмму разброса полученных двух кластеров. Мой набор данных просто в следующем виде: # size, class 312, 1 319 1 227 0...

51 просмотров

python pandas cluster-analysis scikit-learn k-means

17.04.2024