Словари анализа настроений

Мне было интересно, знает ли кто-нибудь, где я могу получить словари положительных и отрицательных слов. Я изучаю сентиментальный анализ, и это его важная часть.


person user387049    schedule 15.11.2010    source источник


Ответы (9)


Возможно, вам нужен лексикон настроений Университета Питтсбурга. Это лексикон из около 8000 слов с позитивным / нейтральным / негативным настроением. Более подробно он описан в этом документе и выпущен под GPL.

person Stompchicken    schedule 16.11.2010

Придя немного поздно, отмечу, что словари имеют ограниченный вклад в анализ настроений. Некоторые сантиментальные предложения не содержат слов о сантиментах - например, «прочтите книгу», что может быть положительным в рецензии на книгу и отрицательным в рецензии на фильм. Точно так же эмоциональное слово «непредсказуемый» может быть положительным в контексте триллера, но отрицательным при описании тормозной системы Toyota.

и многое другое ...

person ScienceFriction    schedule 17.02.2011
comment
Действительно хорошие моменты. К счастью для меня, я имею дело только с определенными новостными источниками, которые воздерживаются от использования сленга и обычно просто констатируют факты. Тем не менее, все же определенно есть о чем беспокоиться, спасибо. - person user387049; 18.02.2011
comment
Я думаю, что при использовании словарей без контекста есть надежда, что, хотя для отдельных предложений может быть определенное количество шума (неправильная классификация), в совокупности будет достаточно сигнала, чтобы иметь смысл. Однако я не уверен, как можно было бы проверить эту надежду со статистической строгостью. - person mcduffee; 08.08.2014


Профессор Бинг Лю предоставил лексикон английского языка объемом около 6800 слов, вы можете скачать его по этой ссылке: Анализ мнений, анализ настроений и обнаружение спама с мнениями

person rodobastias    schedule 18.02.2013

В этой статье 2002 года описан алгоритм для автоматического получения такого словаря из образцов текста, используя только два слова в качестве начального набора.

person Fred Foo    schedule 17.11.2010
comment
Проблема в том, что этот подход использует совпадения AltaVista для вычисления PMI-IR, поэтому я не думаю, что он оптимален для тех, кто хочет начать работу. Более того, это неконтролируемый подход, и его результаты все еще не впечатляют по сравнению с контролируемыми подходами. - person Kurt Bourbaki; 14.07.2015

Здесь вы можете найти AFINN, а также создать его динамически. Как и всякий раз, когда появляется неизвестное + ve слово, добавьте его с +1. Как будто банан - это новое слово + ve, которое появляется дважды, тогда оно становится +2.

Чем больше статей и данных вы сканируете, тем лучше ваш словарь!

person user123    schedule 16.08.2013
comment
Этот файл на самом деле является игрушечным файлом, созданным для задания класса. На мой взгляд, использовать его для реальной работы было бы ошибкой. - person mcduffee; 08.08.2014
comment
@mcduffee Подробно? - person jzonthemtn; 18.01.2016
comment
@jbird Я не уверен, что могу добавить. Файл был создан для задания класса, где текст для оценки был адаптирован к словам в списке. В нем отсутствует очень много слов (весь список меньше 2500 слов). Я боюсь, что попытка использовать его с текстом, который не был адаптирован к словам в списке, приведет к менее точным оценкам настроения, чем можно было бы предоставить более полный список. - person mcduffee; 20.01.2016
comment
@mcduffee Это очень помогает. Я не знал этого об этих данных. Спасибо! - person jzonthemtn; 21.01.2016

Каталог словарей Гарварда-IV http://www.wjh.harvard.edu/~inquirer/homecat.htm содержит как минимум два набора готовых словарей для положительной / отрицательной ориентации.

person Kiara    schedule 24.11.2015

Вы можете использовать лексику настроений Вейдера

from nltk.sentiment.vader import SentimentIntensityAnalyzer

sentence='APPle is good for health'
sid = SentimentIntensityAnalyzer()
ss = sid.polarity_scores(sentence)  
print(ss)

это даст вам полярность предложения.

выход:

 {'compound': 0.4404, 'neu': 0.58, 'pos': 0.42, 'neg': 0.0}
person Techgeeks1    schedule 07.03.2017

Sentiwords дает 155 000 слов (и их полярность, то есть оценка от -1 до 1 от очень отрицательного до очень положительного). Лексика обсуждается здесь

person stevec    schedule 08.03.2019