G10LАнализирование или синтезирование речи; распознавание речи; обработка речи или голоса; кодирование или декодирование речи или звука 4

    МПК Классификатор МПК
    • Раздел G ФИЗИКА
      • G10 Музыкальные инструменты; акустика
        • G10L Анализирование или синтезирование речи; распознавание речи; обработка речи или голоса; кодирование или декодирование речи или звука 4
КодНаименование
Синтезирование речи; преобразование текста для систем синтезирования речи
Распознавание речи
Идентификация или верификация говорящего
Методы анализа-синтеза речевого или аудио- сигнала для уменьшения избыточности, например, в вокодерах; кодирование или декодирование речевых или аудио- сигналов, с использованием моделей входных фильтров или психоакустического анализа
Обработка речевого или голосового сигнала для получения другого слышимого или неслышимого сигнала, например визуального или осязательного, для изменения его качества или его разборчивости
Технологии анализа речи или голоса, не ограниченные какой-либо одной группой из G10L 15/00 — G10L 25/00
Тематика, не предусмотренная в других группах данного подкласса

Описание:

Международный патентный классификатор (МПК) - Класс G10L: Анализирование или синтезирование речи; распознавание речи; обработка речи или голоса; кодирование или декодирование речи или звука

Класс G10L в Международном патентном классификаторе (МПК) охватывает широкий спектр технологий, связанных с обработкой речи и звука. В этот класс входят методы и устройства, используемые для синтезирования речи, распознавания речи, идентификации говорящего, а также обработки речевых сигналов для различных целей, включая кодирование и декодирование.

G10L 13/00: Синтезирование речи; преобразование текста для систем синтезирования речи

Этот подкласс включает технологии и устройства, которые преобразуют текстовую информацию в синтезированную речь. Синтезирование речи используется в различных приложениях, от голосовых ассистентов до систем навигации.

Примеры:

  • Текстовые синтезаторы: Программы и устройства, которые преобразуют текст в речь, часто используемые в голосовых помощниках, таких как Siri или Alexa.
  • Системы голосовых оповещений: Устройства, использующие синтез речи для автоматического оповещения, например в общественном транспорте.

G10L 15/00: Распознавание речи

Подкласс G10L 15/00 охватывает технологии и системы, которые анализируют и распознают речь, преобразовывая ее в текст или команды. Эти системы применяются в голосовых помощниках, автоматических переводчиках и системах голосового управления.

Примеры:

  • Голосовые помощники: Системы, такие как Google Assistant, которые распознают речь пользователя и выполняют команды на ее основе.
  • Системы автоматического перевода: Программы, которые распознают речь на одном языке и переводят ее на другой.

G10L 17/00: Идентификация или верификация говорящего

Этот подкласс включает технологии для определения личности говорящего по его голосу. Эти системы используются в безопасности и аутентификации, например для разблокировки устройств или доступа к конфиденциальной информации.

Примеры:

  • Биометрическая аутентификация по голосу: Системы, которые используют уникальные характеристики голоса для идентификации пользователя.
  • Системы доступа на основе голосовой верификации: Устройства, которые позволяют доступ к информации или помещениям только после подтверждения голоса пользователя.

G10L 19/00: Методы анализа-синтеза речевого или аудио-сигнала для уменьшения избыточности; кодирование или декодирование речевых или аудио-сигналов

Подкласс G10L 19/00 охватывает методы и технологии, направленные на сжатие и восстановление речевых или аудио-сигналов. Эти системы используются в телекоммуникациях, мультимедийных приложениях и при передаче аудиоданных через Интернет.

Примеры:

  • Вокодеры: Устройства и алгоритмы, используемые для сжатия речевых сигналов с целью экономии полосы пропускания.
  • Психоакустическое кодирование: Технологии, такие как MP3, которые уменьшают размер аудиофайлов, сохраняя при этом качество звука, воспринимаемое человеком.

G10L 21/00: Обработка речевого или голосового сигнала для получения другого слышимого или неслышимого сигнала

Этот подкласс включает технологии, направленные на изменение или улучшение качества речевого сигнала. Такие системы могут использоваться для улучшения разборчивости речи, изменения тембра или преобразования речи в другой сигнал.

Примеры:

  • Системы шумоподавления в речевых сигналах: Технологии, которые улучшают разборчивость речи, фильтруя фоновые шумы.
  • Голосовые эффекты: Устройства и программы, которые изменяют голос пользователя, например, для создания эффекта робота или искажения голоса.

G10L 25/00: Технологии анализа речи или голоса, не ограниченные какой-либо одной группой из G10L 15/00 — G10L 25/00

Подкласс G10L 25/00 включает в себя методы и устройства для анализа речи или голоса, которые не попадают под другие подклассы. Эти технологии могут быть использованы для исследований или в специализированных приложениях.

Примеры:

  • Анализ эмоций по голосу: Технологии, которые определяют эмоциональное состояние говорящего на основе анализа его речи.
  • Обработка акцентов и диалектов: Системы, которые учитывают региональные особенности речи для улучшения распознавания и синтезирования.

G10L 99/00: Тематика, не предусмотренная в других группах данного подкласса

Подкласс G10L 99/00 включает инновации и разработки, которые не были охвачены другими категориями. Этот подкласс открыт для новых технологий, которые могут появиться в будущем.

Примеры:

  • Экспериментальные методы обработки речи: Новые технологии, которые еще не классифицированы, но представляют интерес для обработки речи и звука.

Таблица примеров

Подкласс Пример устройства или системы Описание
G10L 13/00 Текстовые синтезаторы Преобразование текста в синтезированную речь
G10L 15/00 Голосовые помощники Распознавание речи и выполнение команд на основе голоса
G10L 17/00 Биометрическая аутентификация по голосу Определение личности по голосу
G10L 19/00 Вокодеры Сжатие речевых сигналов
G10L 21/00 Системы шумоподавления Улучшение разборчивости речи
G10L 25/00 Анализ эмоций по голосу Определение эмоционального состояния по речи

Заключение

Класс G10L в МПК включает в себя передовые технологии для анализа, синтеза и обработки речи и звука. Эти технологии играют важную роль в современном мире, обеспечивая функциональность голосовых помощников, безопасность биометрической аутентификации, улучшение качества звука и другие инновационные решения. В будущем можно ожидать появления новых разработок, которые продолжат расширять возможности этого класса.

Приходько Илья Викторович
Эксперт Prilan. Профессиональное консультирование и помощь в области защиты интеллектуальной собственности более 15 лет.
Приходько Илья Викторович
Наши специалисты ответят на любой интересующий вопрос
Задать вопрос