У меня есть файл text
, содержащий слова с неанглийскими алфавитами, и я хочу открыть его, выполнить некоторую предварительную обработку и, наконец, сохранить его как файл csv
. и использовать его где-то еще.
код для чтения и сохранения файла:
with open('file.txt', encoding="utf-8") as f:
train = f.read().splitlines()
затем создайте кадр данных и код для его хранения:
df.to_csv('file.csv', index=True, encoding="utf-8")
до сих пор все кажется в порядке, но когда я пытаюсь открыть файл .csv с помощью этого кода:
train = pd.read_csv('file.csv', encoding="utf-8")
Я сталкиваюсь с этим:
Process finished with exit code -1073740940 (0xC0000374)
не переходя на следующие строки.
также, когда я пытаюсь открыть его с кодировкой ISO-8859-1, все в порядке; но когда я пытаюсь напечатать заголовок этого CSV, он просто печатает несколько вопросительных знаков ('?')
кто-нибудь знает, что происходит не так?
любая помощь будет оценена.