time
— время, дата, день недели, интервал времени. Например, в 15 часов, 23 мая, суббота, завтра, с шести до семи, сейчас. Формат распознавания даты зависит от стандарта, принятого для выбранного языка. Например, для русского языка дата 15 ноября 2004 года записывается как 15.11.2004. Для английского языка — как 11/15/2004.
train-number
— номер поезда. Например, поезд №23.
number
— все числительные. Например, семь, 7.
ordinal
— порядковые числительные. Например, первый, второй.
quantity
— количество чего-либо с единицей измерения, если она есть.
volume
— объем чего-либо с единицей измерения, если она есть.
duration
— длительность чего-либо с единицей измерения, если она есть.
distance
— расстояние от/до/между чем-либо с единицей измерения, если она есть.
temperature
— температура.
amount-of-money
— денежные суммы с символом/названием валюты, если он есть.
credit-card-number
— номер банковской карты.
phone-number
— номера телефонов без проверки на их корректность.
email
— любые email адреса.
url
— веб адреса, которые начинаются с «http».
passport-number
— серия и номер паспорта стран ЕАЭС с частичной валидацией. Поддерживаются:
Также поддерживается упрощенный формат для работы с текстом от ASR — только номер без серии. В этом случае допускается значение из 7 цифр: YYYYYYY.
Во всех форматах между символами допускается использование разделителей — пробелов, дефисов, символа № или слова номер. Между цифрами и буквами не может быть более одного такого разделителя подряд.
gender
— пол/гендер. Поддерживаются классические и разговорные варианты. Приводятся к значениям male
или female
. Перед сравнением все слова лемматизируются.
birthdate
— дата рождения с валидацией значения. Поддерживаются последовательности вида ДД-ММ-ГГГГ, ММ-ДД-ГГГГ, ГГГГ-ММ-ДД, ГГГГ-ДД-ММ, с разделителями пробел, точка, дефис, двоеточие. Год может быть в формате из 2 или 4 цифр. Все части проходят предварительную валидацию: день — от 01 до 31, месяц — от 01 до 12, год — от 1900 до 2050. В случае неоднозначности возвращаются все возможные варианты.
human-name
— ФИО или его части, без разбора на отдельные части (имя, фамилия и отчество), их лемматизации и редкие имена. Например, Илья, Иван Иванов, Саратов, Москва.location
— названия локаций, в том числе части адресов, страны, города и прочее. Например, Тверская улица, Москва, Россия.organization
— названия организаций, компаний, учебных заведений, юридических лиц и прочее. Например, Яндекс.address
— адреса с лемматизацией/стеммингом каждой части адреса (хорошо работает только с РФ адресами). Например, пр. Ленина, д. 15.city-of-country
— название страны, которой принадлежит найденный город/поселок/населенный пункт/деревня/и т.д.train-number
— номера железнодорожных поездов, используемых в РФ. Например, Номер поезда: 456.train-station
— названия железнодорожных станций, имеющихся в РФ, с указанием станции отправления и станции назначения. Например, Казанский вокзал, Москва - Казань.arrival-train-station
— название железнодорожной станции прибытия.departure-train-station
— название железнодорожной станции отправления (дополнение к train-station). Например, Станция отправления: Москва.snils-number
— номер СНИЛС. Поддерживается валидация контрольного числа.train-ticket-number
— номер билета РЖД. Последовательности из 13–14 цифр, без валидации.human-name
— ФИО или его части(имя, фамилия и отчество) и их лемматизации. Например, John Doe.location
— названия зданий, дорог, трасс, мостов, аэропортов и прочей городской инфраструктуры и объектов, названия гор, хребтов, водоемов, стран, регионов, областей, городов и прочие географические именования. Например, Times Square, New York, USA.organization
— названия организаций, компаний, учебных заведений, юридических лиц и прочее.product
— названия различных товаров/продуктов, кроме услуг. Например, транспорт, еда, оружие.title
— заголовки чего-либо, указывается в скобках. Например, «The Great Gatsby».event
— названия исторических событий, спортивных мероприятий. Например, World War II.language
— название языка, указывается в скобках. Например, «English».norp
— названия национальностей, религиозных и политических групп. Например, Japanese.law
— любые отсылки к закону, законодательным документам и их упоминание. Например, The First Amendment.human-name
— ФИО или его части, без разбора на отдельные части (имя, фамилия и отчество) и их лемматизации. Например, Anna Müller.location
— названия локаций, в том числе части адресов, страны, города и прочее. Например, Brandenburger Tor, Berlin, Deutschland.organization
— названия организаций, компаний, учебных заведений, юридических лиц и прочее. Например, L’Oréal.other
— все, что не попало в предыдущие варианты, а так же названия некоторых исторических событий, заголовки чего-либо, название товара/продукта/услуги, национальности, языки, культуры и прочее.