Что такое ансамблевая техника?
Всякий раз, когда у нас есть большое количество данных или мы можем сказать, что всякий раз, когда у нас есть большое количество строк и столбцов в наборе данных, мы используем методы ансамбля.
Например: -
Предположим, у нас есть 50000 строк и 100 столбцов; Здесь такие большие данные не могут быть изучены одной моделью, поэтому в этом случае мы используем методы ансамбля.
Почему мы используем ансамблевые техники?
В методах ансамбля набор данных делится на фрагменты данных или подмножество данных, и эти фрагменты или подмножества изучаются моделью.
Типы техники ансамбля: -
а). Пакетирование (параллельный метод): - В случае пакетирования весь набор данных делится на фрагменты данных, и эти фрагменты предоставляются модели для изучения. Здесь модель учится параллельно набору данных.
б) . Повышение (последовательный метод). В случае повышения весь набор данных изучается моделью, а затем выходные данные модели передаются в качестве входных данных для другой модели, а затем поступает окончательный вывод или результат.
Модели, используемые в бэггинге и бустинге, которые присутствуют внутри scikit Learn: -
а). Упаковка :-
1. Случайный лес
2. Дополнительные деревья
б). Усиление :-
1. АдаБуст
2. Повышение градиента
↣Некоторые советы по модели бэггинга (а) выше: –
я) . Эти модели можно использовать как для классификации, так и для регрессии.
ii) . Все это работает для однородных моделей.
III). Во всех этих моделях нашей базовой оценкой по умолчанию является классификатор/регрессор дерева решений (DTC/DTR).
IV). Классификатор/регрессор дерева решений, количество оценщиков по умолчанию равно 100, это означает, что будет создано 100 деревьев.
v). Классификатор/регрессор дерева решений, по умолчанию критерий «GINI».
↣Некоторые советы по модели повышения (b) выше:-
я) . Эти модели можно использовать как для классификации, так и для регрессии.
ii) . Все это работает для однородных моделей.
III). Во всех этих моделях нашей базовой оценкой по умолчанию является классификатор/регрессор дерева решений (DTC/DTR).
IV). В повышении есть параметр «Скорость обучения», который говорит, что он увеличит обучение модели, а затем даст точность. (Скорость обучения = 1 по умолчанию).
в). алгоритм по умолчанию будет «SAMME.R».
Заключение:-
1. Он используется, когда у нас большой набор данных.
2. Бэггинг и форсирование — две широко используемые техники для Ensemble.
3. Работает для однородных моделей.
4. DTC/DTR являются базовыми оценщиками по умолчанию как при бэггинге, так и при бустинге.
5. В AdaBoost n_estimator = 50 по умолчанию.
— — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — —
Спасибо за чтение и хорошего дня.
— — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — —
Али