Извлекаем данные из скан-образов, настраиваем обработку под типы документов компании и встраиваем результат в действующий контур через интерфейс или API.
Решение полезно компаниям, которые регулярно получают сканы, фотографии или пакеты документов и хотят быстрее переводить их в проверяемые структурированные данные. Конфигурация подбирается под типы документов, качество входящих изображений, правила проверки и способы передачи результата во внутренние системы.

Решение принимает от сотрудника или по API скан документа
С помощью OCR, нейронных сетей и собственных алгоритмов из документов извлекаются данные
Полученные данные в структурированном виде становятся доступны в интерфейсе или передаются по API
Решение уместно там, где поток документов уже влияет на скорость обслуживания, нагрузку бэк-офиса или качество данных в CRM, ERP, документообороте и отраслевых системах.
Анализ и обработка входящего потока документов (в том числе документов без наличия формализованной структуры)
Проверка качества и правильности заполнения входящего потока документов
Классификация документов
Извлечение данных на основе технологий машинного обучения
Проверка корректности полученной информации
Генерация производной информации и передача требуемой информации во внешние системы
Состав поддерживаемых документов настраивается под проект: от типовых удостоверяющих и бухгалтерских документов до договоров, спецификаций и неструктурированных материалов.
Документы физического лица
Бухгалтерские документы
Неструктурированные



etence.ocr можно внедрять в разных отраслях, если есть повторяемый поток документов, требования к скорости обработки и необходимость передавать результат дальше по процессу.
Банки и финансовые организации
Страховые компании
Такси и каршеринг
Бухгалтерские и аудиторские службы
Туризм
IT-платформы
Недвижимость
Юридические компании
Образовательные организации
Интерфейс сотрудника
Обработка изображений
Управление бизнес-процессами
Очередь обработки пакетов документов
Интерфейс помогает работать с пакетами документов, проверять результаты распознавания и выполнять административные настройки решения.
Фильтрация
Для взаимодействия с большим набором обрабатываемых пакетов пользователям предоставляется функционал фильтрации, сортировки и полнотекстового поиска (включающего в себя сквозной поиск по распознанному со скан-изображений тексту) по всем загруженным в Систему пакетам документов.


Контроль данных пользователем
Обработанные Системой документы могут быть проверены пользователями Системы на соответствие обработки с требуемыми метриками качества извлечения информации и преобразования скан-изображений.
При нахождении несоответствий, документы могут быть отмечены специальными маркерами, влияющими на дальнейшие стадии бизнес-процесса обработки пакета.

Этот слой отвечает за предобработку изображений, классификацию, распознавание текста и извлечение нужных полей.

Пакеты документов попадают в очередь обработки. С учётом заданных приоритетов решение выполняет следующие задачи:
Улучшение исходных изображений: увеличение контраста, яркости, подавление шума
Обрезка и поворот изображений
Разбиение многостраничных документов на одностраничные
Разбиение изображений, содержащих несколько документов, на отдельные документы
Классификация каждого полученного документа согласно словарю предопределенных типов документов
Извлечение текстовых данных с изображения
Извлечение ключевых слов, требуемых для конкретного типа документов согласно словарю
Наложение на исходные скан-изображения текстового слоя
Сценарии обработки настраиваются под входные данные, события, правила проверки и передачу результатов во внешние системы.
Настройка входных данных


Настройка событий обработки пакетов
Настройка результатов обработки пакетов документов

Очередь помогает управлять приоритетами, нагрузкой и статусами обработки в режиме реального времени.
Серверная часть решения
Использует технологии, которые можно развернуть в облачной инфраструктуре Kubernetes / Docker:
Клиентская часть решения
Для работы с клиентской частью нужен браузер на рабочей станции.
Если нужно оценить, какие документы стоит распознавать в первую очередь и как встроить обработку в существующий процесс, можно обсудить задачу с командой RobotBull. Мы поможем уточнить входной поток, качество данных, интеграции и границы пилотного внедрения.
© 2018–2026, ООО «РоботБулл Технолоджи» ИНН 9710065224
ОКВЭД 62.01
Сведения об ИТ-деятельности