Публикации по теме 'scikit-learn'
Прогнозирование предпочтений избирателей с помощью классификатора голосования Scikitlearn
В сентябре 2021 года избиратели Калифорнии решили не вспоминать действующего губернатора Гэвина Ньюсома. В августе 2021 года опрос SurveyUSA, спонсируемый San Diego Tribune, KABC-TV Los Angeles и KGTV-TV San Diego обнаружил, что 51% вероятных избирателей проголосовали бы за , чтобы отозвать губернатора Ньюсома, в то время как 40% проголосовали бы. "Нет". После миллионов долларов, потраченных на кампании Да и Нет на то, что считалось близким к выборам. Новостные агентства..
Модели гауссовой смеси (GMM) Кластеризация в Python
Смешанная модель Гаусса ( GMM ) — это вероятностная модель , используемая для кластеризации, оценки плотности и уменьшения размерности. Это мощный алгоритм для обнаружения основных закономерностей в наборе данных. В этом руководстве мы узнаем, как реализовать кластеризацию GMM в Python с помощью библиотеки scikit-learn.
Шаг 1: Импорт библиотек
Алгоритм K-ближайших соседей (KNN) для задач классификации
Теория K-ближайших соседей и реализация с помощью Scikit-Learn
Ссылка на данные, использованные в этом уроке: Данные колледжа Ссылка на Полный блокнот
В статистике k -алгоритм ближайшего соседа ( k -NN ) является непараметрическим Метод классификации , впервые разработанный Эвелин Фикс и Джозефом Ходжесом в 1951 году и позже расширенный Томасом Кавером . Используется для классификации и регрессии . В обоих случаях вход состоит из k ближайших обучающих..
Руководство для начинающих по разделению наборов данных машинного обучения в Python
Разделение набора данных машинного обучения на обучающие и тестовые наборы — важный шаг в процессе построения модели, поскольку он позволяет нам оценить производительность модели на невидимых данных. В этом руководстве мы узнаем, как разделить набор данных на обучающие и тестовые наборы в Python с помощью библиотеки scikit-learn.
1. Импорт библиотек и…
Распознавание рукописных цифр с помощью scikit-learn
Машинное обучение – это развивающаяся технология, которая позволяет компьютерам автоматически учиться на основе прошлых данных. Машинное обучение использует различные алгоритмы для построения математических моделей и прогнозирования с использованием исторических данных или информации. В настоящее время он используется для различных задач, таких как распознавание изображений, распознавание речи, фильтрация электронной почты, автоматическая пометка Facebook, рекомендательная система и..
Вопросы по теме 'scikit-learn'
Проблемы масштабирования с матрицей scipy.sparse при использовании scikit
При решении проблемы машинного обучения с использованием scikit (python) мне нужно выполнить масштабирование матрицы scipy.sparse перед обучением с использованием SVM, чтобы добиться более высокой точности. Но здесь четко указано здесь , что:...
7450 просмотров
schedule
07.05.2024
KL-расхождение двух ОММ
У меня есть два GMM, которые я использовал для размещения двух разных наборов данных в одном и том же пространстве, и я хотел бы рассчитать KL-расхождение между ними.
В настоящее время я использую GMM, определенные в sklearn (...
7963 просмотров
schedule
06.04.2024
Проблемы Python ScikitLearn GridSearchCV с TFIDF - JobLibValueError?
поэтому у меня есть корпус слов, на котором я запускаю TFIDF, а затем пытаюсь классифицировать с помощью логистической регрессии и GridSearch.
Но я получаю огромную ошибку, когда запускаю GridSearch... ошибка такова (она длиннее, но я просто...
1221 просмотров
schedule
23.03.2024
Как использовать параметры инициализации GradientBoostingClassifier в sklearn
Я хочу использовать один sklearn.ensemble.GradientBoostingClassifier для инициализации другого sklearn.ensemble.GradientBoostingClassifier, но возникает ошибка «IndexError: слишком много индексов для массива». Похоже, это ошибка в sklearn, а также...
787 просмотров
schedule
03.04.2024
Scikit-learn: оценка в GridSearchCV
Кажется, что GridSearchCV scikit-learn собирает оценки своих (внутренних) складок перекрестной проверки, а затем усредняет оценки всех складок. Мне было интересно, что за этим стоит. На первый взгляд может показаться более гибким вместо этого...
991 просмотров
schedule
13.04.2024
Выведите взвешенную оценку f1 для KNeighborsClassifier
Я пытаюсь вывести только взвешенную оценку f1 для тестовых данных в KNeighborsClassifier.
Я могу сделать это:
neigh = KNeighborsClassifier(n_neighbors=10)
neigh.fit(X_train, y_train)
result = neigh.predict(X_test)...
321 просмотров
schedule
07.04.2024
Сообщение об ошибке при попытке подобрать тренировочные данные с помощью функции GridSearch
from sklearn.preprocessing import PolynomialFeatures
polyreg = PolynomialFeatures(degree = 4)
param_grid = {'alpha': [0.001, 0.01, 0.1, 1, 10, 100]}
grid_search_polyreg = GridSearchCV(polyreg, param_grid, cv = 5)
grid_search_polyreg.fit(x_train,...
287 просмотров
schedule
22.03.2024
Не удается построить кластеры K-средних для одномерных данных
Я пытаюсь внедрить алгоритм K-средних в свою задачу бинарной классификации, но не могу построить диаграмму разброса полученных двух кластеров.
Мой набор данных просто в следующем виде:
# size, class
312, 1
319 1
227 0...
51 просмотров
schedule
17.04.2024