Что такое ансамблевая техника?

Всякий раз, когда у нас есть большое количество данных или мы можем сказать, что всякий раз, когда у нас есть большое количество строк и столбцов в наборе данных, мы используем методы ансамбля.

Например: -

Предположим, у нас есть 50000 строк и 100 столбцов; Здесь такие большие данные не могут быть изучены одной моделью, поэтому в этом случае мы используем методы ансамбля.

Почему мы используем ансамблевые техники?

В методах ансамбля набор данных делится на фрагменты данных или подмножество данных, и эти фрагменты или подмножества изучаются моделью.

Типы техники ансамбля: -

а). Пакетирование (параллельный метод): - В случае пакетирования весь набор данных делится на фрагменты данных, и эти фрагменты предоставляются модели для изучения. Здесь модель учится параллельно набору данных.

б) . Повышение (последовательный метод). В случае повышения весь набор данных изучается моделью, а затем выходные данные модели передаются в качестве входных данных для другой модели, а затем поступает окончательный вывод или результат.

Модели, используемые в бэггинге и бустинге, которые присутствуют внутри scikit Learn: -

а). Упаковка :-

1. Случайный лес

2. Дополнительные деревья

б). Усиление :-

1. АдаБуст

2. Повышение градиента

↣Некоторые советы по модели бэггинга (а) выше: –

я) . Эти модели можно использовать как для классификации, так и для регрессии.

ii) . Все это работает для однородных моделей.

III). Во всех этих моделях нашей базовой оценкой по умолчанию является классификатор/регрессор дерева решений (DTC/DTR).

IV). Классификатор/регрессор дерева решений, количество оценщиков по умолчанию равно 100, это означает, что будет создано 100 деревьев.

v). Классификатор/регрессор дерева решений, по умолчанию критерий «GINI».

↣Некоторые советы по модели повышения (b) выше:-

я) . Эти модели можно использовать как для классификации, так и для регрессии.

ii) . Все это работает для однородных моделей.

III). Во всех этих моделях нашей базовой оценкой по умолчанию является классификатор/регрессор дерева решений (DTC/DTR).

IV). В повышении есть параметр «Скорость обучения», который говорит, что он увеличит обучение модели, а затем даст точность. (Скорость обучения = 1 по умолчанию).

в). алгоритм по умолчанию будет «SAMME.R».

Заключение:-

1. Он используется, когда у нас большой набор данных.

2. Бэггинг и форсирование — две широко используемые техники для Ensemble.

3. Работает для однородных моделей.

4. DTC/DTR являются базовыми оценщиками по умолчанию как при бэггинге, так и при бустинге.

5. В AdaBoost n_estimator = 50 по умолчанию.

— — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — —

Спасибо за чтение и хорошего дня.

Дмитро Якубовский

Сальваторе Райэли

Криш Найк

Сундас Халид

Редакторы TDS

— — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — —

Али