У меня есть файл csv
с такими заголовками:
Учитывая, что этот test.csv
файл содержит sparse matrix
:
"A","B","C","D","E","F","timestamp"
611.88243,0,0,0,0,0,0
0,9089.5601,0,864.07514,0,0,0
0,0,5133.0,0,0,0,0
Я просто хочу загрузить его как разреженную матрицу/ndarray с 3 строками и 7 столбцами. Если я использую load.txt
, то получаю массив с 3 строками и 7 столбцами.
numpy.loadtxt(open("test.csv","rb"),delimiter=",",skiprows=1)
Теперь мой файл на самом деле огромен: 10 000 столбцов и 7 000 строк. Таким образом, загрузка занимает много времени. Есть ли в scipy/numpy
какой-либо эффективный метод для загрузки матрицы в виде разреженной матрицы или массива, чтобы загрузка занимала меньше времени за счет использования разреженной функции?