Я обрабатываю файл с 10 millions
записями, которые должны быть зациклены среди 8 millions records
, которые также будут зациклены 150000
, я пытался разделить 150000
на 30000
каждый, но все равно заполняет оперативную память 500GB
, пробовал многопроцессорную обработку, но все равно заполняет мою память. делаю это почти неделю, но в итоге я получаю killing all
processesbecause they fill my memory,any help would be appreciated. the coding part of
multiprocessing`здесь< /а>
10 million
показов для каждого из150000
пользователей или для всех пользователей? Являются ли впечатления от8 million
разными предметами? Что означает, что у каждого пользователя есть рекомендательный товар? Каков формат данных? Являются ли строки ключевыми для показа и включают связанного пользователя/элемент? Можно ли предварительно загрузить элементы или пользователей? Пожалуйста, обновите исходный вопрос с разъяснением. - person arewm   schedule 22.06.2016