Информация о системе:
sys.version = 3.5.2 | Anaconda 4.1.1 (64-разрядная версия)
Visual Studio Community 2015: версия 14.0.25425.01, обновление 3
Инструменты Python для Visual Studio: 2.2.40623.00
Инструменты Python для Visual Studio — интеграция Django: 2.2.40623.00
Инструменты Python для Visual Studio — поддержка профилирования: 2.2.40623.00
Код:
import nltk
french_tokenizer = nltk.data.load('tokenizers/punkt/french.pickle')
text = "J’habite aux États-Unis. Où est-ce que vous habitez? Quel est votre film préféré?"
sentList = french_tokenizer.tokenize(text)
print(sentList)
Проблема:
Когда я запускаю этот код построчно в 64-битной интерактивной среде Python 3.5, каждая строка обрабатывается правильно.
Когда я пытаюсь запустить всю программу сразу, я получаю следующую ошибку относительно строки "text =": SyntaxError: (ошибка юникода) кодек 'utf-8' не может декодировать байт 0x92 в позиции 0: неверный старт байт
Возможно связано: я обратился к документации по Python (https://docs.python.org/3.5/howto/unicode.html) и попробовали некоторые из их примеров кода и столкнулись с похожей проблемой:
répertoire = "/tmp/records.log"
отлично работает в 64-битной интерактивной среде Python 3.5, но выдает следующее при запуске как часть файла .py (не запускает остальную часть файла, включая очень простые команды «печати», которые предшествуют ему):
Программа '[13644] python.exe' завершилась с кодом 1 (0x1).
У кого-нибудь есть мысли о том, почему это может происходить / как исправить эту ошибку?
Python 64-bit 3.5
?) - person Anonymous   schedule 05.02.2017