Сущность — это последовательность слов, объединенных по смыслу или правилу. Они представляют собой конкретную информацию, такую как дата, время, место, имя, цвет, размер, количество, тип товара или услуги и т.д. Сущности не связаны с намерениями и функционируют независимо от них.
Например, фразы «пылесос вертикальный беспроводный» или «моющий робот-пылесос», относятся к сущности «Тип пылесоса». Выражения «китайская стиралка как можно более узкая» или «стиралка Samsung из двухсотой серии» относятся к сущности «Тип стиральной машины».
Существует 2 вида сущностей:
- Системные (предустановленные) – это сущности, доступные для каждого агента, которые предоставляют основную информацию, обрабатываемую системой NLU. Их нельзя добавить, изменить или обучить, этим процессом занимаются разработчики. Список системных сущностей.
Если необходимо внести изменения или дополнения в системные сущности, обратитесь в техническую поддержку.
- Пользовательские – позволяют увеличить точность распознавания намерений. Создаются и настраиваются пользователем. С их помощью можно выделять любую нужную информацию во фразах. После определения сущности, ее можно записать в переменную для дальнейшего использования в сценарии.
- Каждый обучающий пример в каждом намерении необходимо размечать, если в нем есть слова, подходящие под одну из известных сущностей. Даже если эта сущность неуместна и не нужна в данном намерении, это все равно необходимо делать, так как классификатор сущностей обучается на всех примерах, вне зависимости от того, есть ли там сущности или нет, и он никак не связан с классификатором намерений (они независимы друг от друга).
- Запрещено пересечение сущностей в обучающих примерах. Например, во фразе «ведущий инженер по подготовке производства» необходимо выделить только сущность «ведущий инженер по подготовке производства» – сущности «ведущий инженер» и «инженер» выделять нельзя.
- Знаки препинания внутри сущностей игнорируются, поэтому можно писать все обучающие примеры для сущностей без них. Например, «ведущий инженер, город Москва» – излишний пример, запятую там можно не указывать.
- Порядок слов сущности во фразе также является признаком, который используется системой для поиска сущностей. Положение сущности во фразе при этом значения не имеет. Рекомендуется добавлять примеры с разным порядком слов в сущности, если это уместно. Например, «ведущий инженер», «ищу вакансию ведущего инженера», «ведущий инженер в Москве», «вакансия инженера ведущего в Екб есть у вас», «есть ли какая-нибудь вакансия на инженера ведущего где-нибудь в пределах Подмосковья».
- Контекст сущностей не влияет на их обучение и точность их извлечения. В принципе, для извлечения какой-либо простой сущности достаточно пары примеров (например, «компьютер», «ноутбук», «ноут», «лэптоп», «комп»). Однако для стабильной работы рекомендуется указывать минимум 15-20 примеров для каждой сущности.
- При использовании сущностей необходимо учитывать, что многие из них являются стандартными (базовыми) и извлекаются по умолчанию. То есть, такие сущности, как дата, время, место, адрес, имя, ФИО, число, сумма заводить не имеет смысла – они извлекаются в любом случае и только излишне усложнят обучающие примеры.