Аннотация текстовых данных

Текст является наиболее часто используемым типом данных. Аннотации данных текста включают в себя различные аннотации, такие как настроение, намерение, атрибут, отношение, сущность, категория и поиск.

Целью текстовых аннотаций является помощь машинам в понимании естественного человеческого языка. Целями являются ключевые слова, символы, фразы или предложения и даже подразумеваемые эмоции. Таким образом, машины учатся распознавать человеческие намерения или эмоции в тексте и побуждают робота точно позиционировать человеческие эмоции.

01 Маркировка именованных объектов

Аннотации сущностей: Аннотации сущностей должны извлекать объекты в предложении, например ТВ, футбол, дверь и т. д. Иногда необходимо классифицировать предложение, например музыку, энциклопедию, новости и т. д. или обозначить инструкции к действию в тексте (открытие двери, игра и т. д.). Многие предприятия будут применять маркировку именованных объектов в различных сценариях приложений.

02 Эмоциональная аннотация

Сентиментальная аннотация: этот тип аннотации обычно должен определять эмоцию, содержащуюся в предложении, например эмоциональную аннотацию (положительную, нейтральную, негативную), и она будет разделена на шесть или даже двенадцать эмоциональных аннотаций для высокие требования. Аннотаторы-люди часто работают на всех онлайн-платформах, включая социальные сети и сайты электронной коммерции, чтобы оценивать настроения и комментарии, а также сообщать об оскорбительных, деликатных ключевых словах или новых словах.

03 Аннотация отношений

Маркировка отношений — это задача назначить важные метки для синтаксических и семантических отношений сложных предложений.

Граф знаний, также известный как база знаний, используется клиентами для запросов и рассуждений. Структура графа знаний включает сущности, атрибуты и отношения. Например, если пользователь спросит: «В каком городе находится Эйфелева башня», машина ответит: «Это Париж».

04 Аннотация о намерениях

Поскольку люди все чаще используют взаимодействие человека с компьютером для общения, машины должны понимать естественный язык и намерения пользователя. Сбор и классификация данных с несколькими намерениями могут разделить намерения на несколько ключевых категорий, включая запросы, заказы, резервирования, направления и подтверждения.

Если клиент явно хочет запросить погоду, у него есть такие намерения, как «запросить погоду», «запросить погоду-дождь», «запросить погоду-туман», «запросить погоду-температуру» и так далее.

05 Семантическая аннотация

Семантическая аннотация может улучшить списки продуктов и гарантировать, что клиенты найдут то, что ищут. Службы семантической маркировки помогают обучать алгоритмы идентифицировать компоненты и повышать общую релевантность поиска, маркируя названия продуктов и отдельные компоненты в поисковых запросах.

Конец

Передайте свои задачи по маркировке данных на аутсорсинг в ByteBridge, и вы сможете получать высококачественные обучающие наборы данных машинного обучения дешевле и быстрее!

  • Бесплатная пробная версия без кредитной карты: вы можете быстро получить образец результата, проверить результат и оставить отзыв непосредственно нашему менеджеру проекта.
  • 100% подтверждено людьми
  • Прозрачное и стандартное ценообразование: доступны четкие цены (работа включена)

Почему бы не попробовать?

источник: https://www.sohu.com/a/508313109_518843?spm=smpc.author.fd-d.5.1641267456122R4TP2sA