Сборочная линия NLU по умолчанию¶
Сборочная линия NLU по умолчанию¶
В разделе Сборочная линия NLU по умолчанию можно настроить компоненты и параметры конвейера (pipeline).
Сборочная линия NLU новых моделей по умолчанию — это конвейер (pipeline) для обработки и обучения моделей Natural Language Understanding (NLU). Этот конвейер определяет последовательность шагов, которые выполняются для обработки текстовых данных, извлечения намерений и сущностей, а также для обучения модели.
Конвейер (pipeline) задается в конфигурационном файле config.yml
в разделе pipeline
.
Содержание инструкции:
Компоненты сборочной линии NLU¶
Конвейер NLU по умолчанию включает следующие компоненты:
-
Токенизатор (Tokenizer):
- Разделяет текст на отдельные слова или токены.
- Пример:
WhitespaceTokenizer
илиSpacyTokenizer
.
-
Извлечение признаков (Featurizer):
- Преобразует текст в числовые векторы, которые могут быть обработаны моделью.
- Пример:
CountVectorsFeaturizer
илиSpacyFeaturizer
.
-
Классификатор намерений (Intent Classifier):
- Определяет намерение пользователя на основе текста.
- Пример:
DIETClassifier
илиEmbeddingIntentClassifier
.
-
Извлечение сущностей (Entity Extractor):
- Извлекает сущности (например, имена, даты, места) из текста.
- Пример:
CRFEntityExtractor
илиSpacyEntityExtractor
.
-
Компоненты для обработки языка:
- Например, лемматизация, стемминг или обработка стоп-слов.
- Пример:
SpacyNLP
илиLanguageModelFeaturizer
.
Пример сборочной линии NLU¶
pipeline:
- name: WhitespaceTokenizer
- name: RegexFeaturizer
- name: LexicalSyntacticFeaturizer
- name: CountVectorsFeaturizer
- name: CountVectorsFeaturizer
analyzer: char_wb
min_ngram: 1
max_ngram: 4
- name: DIETClassifier
epochs: 200
- name: EntitySynonymMapper
- name: ResponseSelector
epochs: 100
Изменение сборочной линии NLU¶
Чтобы внести изменение в сборочную линию NLU в интерфейсе Wisebot:
-
Перейдите в раздел Администрирование → Настройки → Сборочная линия NLU по умолчанию.
-
Внесите изменения.
- Нажмите Сохранить.
- Обучите модель NLU с использованием нового конвейера.