![]() |
|
Распознавание картинок штрихкодов из файла pdf | ☑ | ||
---|---|---|---|---|
0
ammorf
25.12.24
✎
09:32
|
Приветствую всех! Скажите, существует ли какое то решение в виде компоненты или библиотеки которые позволят считывать из загруженного pdf файла картинки штрихкодов и выводить их значение в виде строки. Спасибо заранее :)
|
|||
1
Asmody
25.12.24
✎
09:58
|
У 1С есть целый сервис распознавания документов
|
|||
2
Asmody
25.12.24
✎
10:00
|
Можно в какую-нибудь нейроночку кидать, они тоже с таким справляются. Кажется, Низамов у себя в ютубчике показывал, как что-то такое на коленке собрать.
|
|||
3
LinuxOrg
25.12.24
✎
10:15
|
Pyzbar
ZXing ZXing.net Google Vision API AWS Rekognition Zebra Crossing (ZXing) REST API Dynamsoft Barcode Reader |
|||
4
ammorf
25.12.24
✎
10:18
|
(3) да я в гитхабе их и нашел, и похоже что бы их использовать придется свою библиотеку делать... Google Vision API вроде ничего.
|
|||
5
LinuxOrg
25.12.24
✎
10:34
|
Barcode4J
|
|||
6
LinuxOrg
25.12.24
✎
10:35
|
(4) кого - их?
|
|||
7
H A D G E H O G s
25.12.24
✎
10:59
|
(0) Вас ждет дорога приключений.
|
|||
8
ammorf
25.12.24
✎
11:08
|
(7) я уж понял как только в инет полез искать инфу)))
|
|||
9
ammorf
25.12.24
✎
11:09
|
(6) сервисы типа ZXing
|
|||
10
LinuxOrg
25.12.24
✎
11:10
|
||||
11
LinuxOrg
25.12.24
✎
11:13
|
(9) то есть вы выбираете Zxing rest api?
|
|||
12
2mugik
25.12.24
✎
11:33
|
(0)имэйдж мейджик + зебар. Но вначале в картинку(пнг) из пдф с помощью чего-то что использует кайро.
|
|||
13
ammorf
25.12.24
✎
12:00
|
(11) пока изучаю все) спасибо всем за советы))
|
|||
14
MWWRuza
25.12.24
✎
12:17
|
Немного не в тему, топик-стартеру, как я понял, нужно решение для постоянной работы, что-бы это автоматом работало из 1С, и ШК, как я понял, линейные... Но, на ИнфоСтарте было решение, под похожую задачу: https://infostart.ru/1c/tools/1310318/
Правда, там не совсем автоматом это все делается - сначала одной обработкой из PDFки выдергиваются картинки ШК DM в отдельные файлы JPEG, а потом, они распознаются, и получается текстовый файл с содержимым ШК DM. Посмотрите, может поможет и натолкнет на путь решения Вашей задачи. PS Мне в свое время, эта публикация очень помогла - когда была "акция по маркировки "левых остатков тапочек и шмоток" в рознице", клиенты массово заказывали ШК марок в ЧЗ... Но, бестолковость не позволяла сохранять их сразу в csv - "типа, че это такое непонятное - ???", сохраняли в PDF (ну, типа а чего не так, готовые марки!), а там формат, ну мягко говоря "не для удобной печати на наклейки"... А второй раз скачать уже полученные ШК в текст - ЧЗ не давал... Говорят - "надо напечатать!" А как? Их тысячи... В ручную не переформатировать. Эти обработки очень помогли, после них, у меня были файлы текстовые с марками, а уж напечатать наклейки по ним - дело техники, там-же на ИнфоСтарте есть моя обработка для этого :-) PSS А вообще, конечно надо задачу смотреть - если это разово, то можно воспользоваться решением с ИнфоСтарта с минимальными доработками, а если действительно нужно "на постоянку", то проще избавиться от такого гимороя - поставить вопрос, что-бы документы присылали в ЭДО с нормальными ШК строкой, а не картинки распознавать. |
|||
15
Garykom
25.12.24
✎
12:24
|
(0) хехе, какие интересные темы всплывают
"github.com/makiuchi-d/gozxing" "github.com/sunshineplan/imgconv" "github.com/sunshineplan/pdf"
|
|||
16
Garykom
25.12.24
✎
12:27
|
(15)+ суть преобразовываем pdf в картинки png
затем через gozxing (порт либы zxing на go) распознаем ШК работает замечательно пока качество хорошее, например чеки с электронных магазинов сразу в pdf на реальных же сканах хренового качества с выцветших чековых лент - все плохо |
|||
17
2mugik
25.12.24
✎
12:28
|
(14)Может у него потоковое сканирование документов или как там это называется.
|
|||
18
2mugik
25.12.24
✎
12:30
|
(16)Да при плохом качестве процент распознания тоже плохой.) Может нейронки помогут? Ну так в качестве бреда...
|
|||
19
Garykom
25.12.24
✎
12:32
|
(18) ИИ помогут подбирать параметры предобработки картинок
для изменения контрастности и т.д. и вырезки ШК в отдельные картинки еще в чб или оттенки серого переводить если цветные и т.д. короче все сложно и потянет на отдельный подпроект самое главное откуда обучающую выборку брать |
|||
20
АгентБезопасной Нацио
25.12.24
✎
12:42
|
||||
21
Злоп
25.12.24
✎
12:47
|
(14) у меня именно так и было, менеджеры хреновы. В результате что о качнул с ИС, восьмерочник наш подделал и все получилось. Но тонкости уже не помню.
|
|||
22
H A D G E H O G s
25.12.24
✎
12:58
|
Веселые истории экран покажет наш.
Автор, знай, если это ЧестныйЗнак, то там вполне могут быть не картинки. |
|||
23
Garykom
25.12.24
✎
13:30
|
(22) если это ЧЗ то лучше как картинки
ибо формат внутри PDF может поменяться в любой момент а с хорошего качества (не сканов) штрихкоды прекрасно через zxing читаются |
|||
24
H A D G E H O G s
25.12.24
✎
13:37
|
Матрица Datamatrix может быть набрана квадратиками при помощи языка TrueScript, прямо внутри pdf файла, без всякого хранения картинки.
Ииии, чтобы что-то при этом распознать - pdf нужно отрендерить встроенными pdf-средствами. Живите теперь с этим. |
|||
25
Звездец
25.12.24
✎
13:39
|
у каждой задачи есть начало. Может и не надо каждую задачу решать в лоб, а стоит уточнить там где этот файл сделали по поводу других форматов?
|
|||
26
ammorf
25.12.24
✎
14:24
|
(23) все именно таки обстоит.. я теперь в легкой прострации)))
|
|||
27
ammorf
25.12.24
✎
14:25
|
(24) я пробовал онлайн сервисом парсить pdf файл и он расшифровал эти штрихкоды в текст
|
|||
28
LinuxOrg
25.12.24
✎
14:39
|
(24) TrueScript нет такого языка
|
|||
29
LinuxOrg
25.12.24
✎
14:43
|
(19) Примеры в студию
|
|||
30
LinuxOrg
25.12.24
✎
23:00
|
(15) там же не все портировано
|
|||
31
Волшебник
25.12.24
✎
23:30
|
(28) ошиблись?
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |