Регулярные выражения¶
Регулярные выражения¶
Регулярные выражения задают дополнительные признаки для классификации намерений и извлечения из них сущностей. Они позволяют точно и гибко находить определённые последовательности символов, такие как номера телефонов, email-адреса, даты, коды и другие структурированные данные.
Регулярные выражения особенно полезны, когда сущности имеют чёткий формат, который можно описать с помощью шаблонов.
Содержание инструкции
Для чего нужны регулярные выражения¶
-
Извлечение структурированных данных:
Регулярные выражения позволяют извлекать сущности, которые имеют определённый формат. Например:- Номера телефонов:
+7 (999) 123-45-67
. - Email-адреса:
example@domain.com
. - Даты:
2023-10-15
. - Коды:
ABC-123
.
- Номера телефонов:
-
Упрощение обработки текста:
Если сущности имеют чёткий шаблон, регулярные выражения позволяют извлекать их без необходимости обучать модель на большом количестве примеров.
-
Повышение точности:
Регулярные выражения обеспечивают высокую точность извлечения сущностей, так как они работают на основе строгих правил, а не статистических моделей.
-
Обработка сложных случаев:
Регулярные выражения могут использоваться для извлечения сущностей, которые сложно выделить с помощью стандартных методов (например, комбинации чисел и букв).
Добавление регулярных выражений¶
Чтобы добавить регулярное выражение:
-
Откройте Wisebot и убедитесь, что настраиваете нужного бота. В боковом меню должно отображаться его имя.
-
Откройте раздел NLU → раздел Обучающие данные → вкладка Регулярные выражения.
-
Установите курсор в поле Название и укажите имя сущности, для которой необходимо указать регулярное выражение. Например,
phone_number
. - Укажите значение выражения в поле справа. Например,
\+\d{1,3} \(\d{3}\) \d{3}-\d{2}-\d{2}
— регулярное выражение для номеров телефонов в формате+7 (999) 123-45-67
и\d{1,3}-\d{3}-\d{3}-\d{2}-\d{2}
— регулярное выражение для номеров телефонов в формате8-999-123-45-67
. - Нажмите кнопку Добавить.