Aris

OCR распознавание счёт-фактур и накладных: реквизиты в Excel за 30 секунд

Опубликовано ·

Бухгалтер получает в день 20-50 первичных документов: счёт-фактуры, ТОРГ-12, УПД, акты. Часто это сканы и фото из мессенджеров — со сжатием, наклоном, тенями. Ручной ввод занимает 5-7 минут на документ. Aris делает это за 30 секунд, и реквизиты с позициями попадают сразу в таблицу для 1С или Excel.

Что распознаёт OCR в Aris

  • Реквизиты сторон — наименование, ИНН, КПП, ОГРН, БИК, расчётный счёт, корсчёт, юр. адрес. Из шапки и подвала документа.
  • Номер и дата — счёт-фактуры, накладной, договора-основания.
  • Позиции таблицы — наименование, код, количество, цена за единицу, сумма без НДС, ставка НДС, сумма с НДС.
  • Итоговые суммы — общая, НДС, без НДС, прописью.
  • Печати и подписи — отмечаются как присутствующие, без расшифровки (для аудита подлинности).

Сложные случаи — что отличает Aris от «среднего» OCR

Сканы под углом или с тенями. Сначала идёт геометрическая нормализация (выпрямление, кропом по контуру листа), потом OCR, потом ИИ разбирает текст на структурированные поля. Без этого этапа цена «10 000,00 ₽» легко превращается в «1О ОООLОО ₽».

Многостраничные накладные. ТОРГ-12 на 200 позиций — частая история в стройке и оптовой торговле. Aris собирает все страницы в одну таблицу, не теряя нумерацию строк, и сверяет общую сумму с заявленной в подвале (если расходится — флажок «проверьте»).

Сканы из мессенджера. WhatsApp и Telegram сжимают фото до 1-2 Мп — мелкий шрифт становится нечитаемым обычными OCR-движками. Aris в этом случае использует ИИ-модель с пониманием контекста: «семь нулей после запятой» восстанавливаются по соседним строкам и формату сумм.

Куда выгружается результат

  • CSV / Excel — для импорта в 1С, БухСофт, Контур.Эльбу.
  • JSON — для интеграций через API: своя учётная система, складская программа, ERP.
  • Прямая отправка в ArisCell — открыть как готовую таблицу и сразу подредактировать.

Где это работает

Распознавание доступно:

  • в кабинете ai-letters.ru — перетаскиваете скан в окно, через 30 секунд получаете таблицу;
  • в десктоп PDF Reader — там включается через меню «Извлечь данные», работает офлайн на встроенном OCR-движке (rapidocr);
  • через API — для пакетной обработки сотен документов из почты или файлового хранилища.

Российский ИИ, данные в РФ

OCR и распознавание реквизитов идут на российских моделях (GigaChat, YandexGPT) или на локальной модели в контуре оператора. Данные хранятся в России (152-ФЗ ст. 18 ч. 5), иностранные облака вроде Google Vision и AWS Textract не используются и не могут использоваться — это запрещено политикой провайдеров в коде.

Распознать счёт →   Подробнее про извлечение полей

← Все статьи блога