Имя: Пароль:
1C
1С v8
Оптическое распознание текста
0 mzelensky
 
08.11.12
12:45
Доброго всем!

Стоит общая задача - автоматизировать процесс внешнего документооборота. Конкретная задача - взять входящий файл (пдф или картинку), разложить файл на составные части (элементы), по этим элементам определить тип файла (например, счет-фактура), затем распознать текст документа и произвести с этим текстом определенные манипуляции.

Т.е. как бы это слела человек сейчас - взял файлик (картинку), посмотрел что это за файл (определил тип дока), обработал файл ФайнРидером и полученный результат перенес в базу (либо сразу руками набивал).

Необходимо автоматизировать.Кто-нибудь над таким заморачивлся?!
1 Нуф-Нуф
 
08.11.12
12:47
Abby. Не давно был на презентации возможности их ПО. Был впечатлен.
2 almar
 
08.11.12
12:47
(0) Собственно разработчики ФайнРидера и заморачивались. У них есть готовые решения.
3 Steel_Wheel
 
08.11.12
12:47
wiki:Нейронная_сеть_Хопфилда

Или купить text recognition tool
4 mzelensky
 
08.11.12
12:48
(0)после анализа рынка было найдено 2 продукта от Абби и Когнитив. Абби не подходит т.к. они за лицензию (минимальную) просят 100 тыров в год (КАЖДЫЙ ГОД!!!) (при этом сетевая версия этой проги уже обойдется порядка 1 МЛН в ГОД!!!).

Когнитив дешевле, но немного ограничен по функционалу.Самое противное - там нельзя самостоятельно создавать макеты видов документов. Это нужно заказывать их прогам, а на это уходит уйма времени (порядка1-2 месяцев).
5 PiVa123
 
08.11.12
12:48
(0) Распознавание кодом 1С?
6 Cube
 
08.11.12
12:48
(0) Дай угадаю... БЕСПЛАТНО?))
7 mzelensky
 
08.11.12
12:48
(2) прочти плиз (4) :)
8 Нуф-Нуф
 
08.11.12
12:48
+(1) может отсканированный документ определить как счет-фактуру, счет, накладную. распознать все поля и табличные части. выдать в хмл или запихнуть сразу в учетную программу
9 MaxisUssr
 
08.11.12
12:49
(0)
Копайте в сторону FineReader+API. Но он денег стОит. Если рукописный текст нужен также - плюсуйте FlexiCapture+API
10 mzelensky
 
08.11.12
12:49
(6) Конечно нет! Деньги готовы платить, но не такие как в случае с АББИ
11 Нуф-Нуф
 
08.11.12
12:49
только ценник там да... меньше 1млн врядли :)
12 mzelensky
 
08.11.12
12:49
(9) "FlexiCapture+API" :

Абби не подходит т.к. они за лицензию (минимальную) просят 100 тыров в год (КАЖДЫЙ ГОД!!!) (при этом сетевая версия этой проги уже обойдется порядка 1 МЛН в ГОД!!!).
13 Cube
 
08.11.12
12:50
(10) А что такое? 100 т.р. в год, это 8.5 т.р. в месяц. Где вы сотрудника на такую з/п найдете, который будет лопатить такой объем первички?
14 MaxisUssr
 
08.11.12
12:51
Есть 1С:Документооборот - по-моему, в него интегрирована некая подсистема распознавания сканов (могу ошибаться)
15 mzelensky
 
08.11.12
12:51
(13) это МИНИМАЛКА! локальная версия с ограничением количества доков в 5000 (если привысил количество - лицензия слитает)
16 mzelensky
 
08.11.12
12:52
(14) не видел там такого....можешь более конкретно?
17 Cube
 
08.11.12
12:52
(15) 5000 доков в день?
18 almar
 
08.11.12
12:52
Во-во. Нанять кучу девочек всяко дешевле будет.
19 MaxisUssr
 
08.11.12
12:53
(0)
Сталкивался с подобным, но было проще - анализировать "закрашенные квадратики" в анкете. Денег на Abbyy не давали, результат - написал самопал на C#. Писал долго правда, но работает :)
20 Нуф-Нуф
 
08.11.12
12:53
Хорошие, качественные вещи стоят денег. Нищеброды могут нанимать таджиков за копейки дла обработки документов. Нормальные конторы понимают эффективность подобных систем и готовы платить за них деньги
21 mzelensky
 
08.11.12
12:53
(17) в ГОД
22 MaxisUssr
 
08.11.12
12:55
(21)
Это 13 документов в сутки. Бессмысленно :) Другой вопрос, если какие-то массовые поступления, которые нужно обработать за 30 мин. А в какую цену дополнительный пучок лицензий?
23 mzelensky
 
08.11.12
12:55
(20)ты сейчас опустил не одну тысячу фирм!
В Краснодарском крае только у ОДНОЙ фирмы внедрена эта ерундовина - ЮГАвто
24 Gantosha
 
08.11.12
12:55
году в 2005 делал такое для чтения метро и керри .. что сказать .. паленый фанридер + шаблоны + какаие то скрипты и какой то г-но код в 1с для чтения этого.
25 mzelensky
 
08.11.12
12:56
(22) Просто новая лицензия. Т.е. ты как бы не доплачиваешь за привышение - если привысил - покупаешь новую лицензию (т.е. еще 100 тыров).
26 Cube
 
08.11.12
12:57
(22) 19 доков в сутки. Рабочих дней, в среднем 22, а не 31)
(21) Нормальная цена. Попробуй работника за такую же цену найти...
27 mzelensky
 
08.11.12
12:57
(24) и как? работает?
28 Gantosha
 
08.11.12
12:58
(27) года два работало типа для заказов от сетивиков .. потом меня выгняли из той фирмы, потом владельца посадили или не посадили ..да работает .. но шаблоны то каждый раз надо подстраивать и код в 1с менять ..
29 mzelensky
 
08.11.12
13:00
(26) ну как сказать...получается обработка одного листа стоит порядка 20 рублей. А объемы документооборота предполагаются очень внушительные. В итоге Не мало!

+ Денег стоит разработка каких-то сложных макетов документов - это заказывается у разработчика.
30 MaxisUssr
 
08.11.12
13:01
(28)
Кстати в Fine reader'е (паленом) есть командная строка, из которой можно его запустить и программно отсканить какой-нибудь документ. А дальше - вроде и сохранить результат можно также программно (в виде текста или экселя). Автору - как вариант.
31 Cube
 
08.11.12
13:03
(29) Может вам удаленщиков на это дело подсадить? Ты им скан, они в твою веб-форму вбивают его... Не?))
Ну, типа, как индусы капчи разгадывают... :)
32 Gantosha
 
08.11.12
13:03
(30) именно так и делалось ..т.е. для разных поставщиков были разные шаблоны распознавания .. дергались скрипты которые выкладывали текстовые файлы которые потом загонялись в 1с.. правда как только какие то обноления у сетивиков сразу надо было обновлять шаблоны. С тех пор я ненавижу IDE и компанию которую разворачивала его у метро ..потому что на картинку они перешли специально ..что бы вынудить всех поставщиков поднять у себя электронный обмен документами.
33 Cube
 
08.11.12
13:04
(0) А не проще вам на электронный документооборот перейти?
34 Cube
 
08.11.12
13:05
+(33) Сейчас, вроде, активно внедряется в массы...
35 mzelensky
 
08.11.12
13:05
(30) Не совсем тот вариант. Точнее в моем случае не панацея. Мне нужно не просто распознать - нужно разбить документ на элементы...ну т.е. что в этом длоке наименвоание продавца, в этом блоке реквизиты банка, в том блоке таблица..и т.д.
36 Нуф-Нуф
 
08.11.12
13:06
купите таджиков. имхо дешевле будет на порядок
37 MaxisUssr
 
08.11.12
13:06
(31) А еще круче - написать простую программу (на сях, например), которая будет сжимать скан документа до размера 10 на 10 пикселей (или больше - подбирать экспериментом). И уже анализировать эти 100 пикселей - далее будет существовать N папок, где N - количество типов документов. Система будет анализировать картинку 10х10 и перекидывать оригинал в ту папку, вид в которой наиболее подходит к картинке. А дальше уже люди будут руками заходить в просмотрщик и ставить галочки (веерно/неверно), если неверно - люди же будут устанавливать вручную тип док-та
38 mzelensky
 
08.11.12
13:06
(33) не вариант. Точнее он применяется, но эта ерунда 100% нужна...
39 Gantosha
 
08.11.12
13:07
(34) сколько стоит передача сейчас одного документа в среднем ?
40 mzelensky
 
08.11.12
13:07
(37) уже рассматриваем подобный вариант....т.е. будем, возможно, кодить убийцу АББИ :)
41 mzelensky
 
08.11.12
13:08
(39) тут вопрос не только в ЦЕНЕ - вопрос в автономности. Чтобы процесс шел самостоятельно без участия человека.
42 Cube
 
08.11.12
13:09
(39) Можно свои стандарты разработать, а контрагентам раздать обработки для типовых конфигураций, которые будут выгружать в вашем формате. И ни пыли, ни шума.
43 Naumov
 
08.11.12
13:09
(38) Что мешает с контрагентами договариваться об удобоваримом обмене в электронном виде?
44 Cube
 
08.11.12
13:11
+(42) Можно веб-сервис, а обработка у контрагента будет прямо в веб-сервис ваш данные передавать. А это почти прямая запись в БД. Вообще лепота...
45 Gantosha
 
08.11.12
13:12
(42) просто я помню что стоимость который нам выкатил навикон за обмен с метро сильно расстроил директора и мне пришлось мучаться.
46 mzelensky
 
08.11.12
13:13
(42) не вариант. Нам прийдется подстраиваться под них, а не наоборот.
47 mzelensky
 
08.11.12
13:14
(43) а ты договариваешься с тараканом перед тем как прихлопнуть его?
48 Cube
 
08.11.12
13:14
(46) Ага, ПФР под всех подстраивается, а не наоборот... :)
49 Gantosha
 
08.11.12
13:14
(41) любая автономность это результат запрограммированной рутины. Например после кривого факса у тебя никакой заказ уже не прочитается .. и надо просить что бы кто то проверял как он получен
50 mzelensky
 
08.11.12
13:15
(44) НЕТ! Я же сказал что нужно! не мути воду!

Кто тебе сказал, что клиент вообще работает с 1С, кто тебе сказал .что клиент вообще из РОССИИ?
51 mzelensky
 
08.11.12
13:16
(49) ну, исключения бывают. Тут никуда.
52 mzelensky
 
08.11.12
13:17
(51) но система должна это обработать и выдать человеку результат, что именно этот файл вызвал у нее затруднения. Именно этот один, а не пара сотен других (которые нормальные)
53 Cube
 
08.11.12
13:17
(50) В веб-сервис передаются те же данные, что и в печатной форме. Разница, что напечатать, что в веб-сервис загнать? Нету разницы. А веб-сервисы - это не 1С придумала. Это широко распространено и передавать в них данные можно практически из любого язывка программирования. Можешь и веб морду для него сделать.
54 mzelensky
 
08.11.12
13:19
(53) печать и росписи клиенты на монитор ставить будут?
55 Naumov
 
08.11.12
13:20
(47) Информация из открытых источников скорее и так доступна в эл.виде
56 Gantosha
 
08.11.12
13:20
да, в россии без этого никуда .. жалко что марки клеить на надо, а то бы еще и почта поднялась бы.
57 Cube
 
08.11.12
13:22
(54) Печать и росписи на бумаге получишь. А за несоответствие бумаги с электронным вариантом уже несет ответственность тот, кто передавал...
58 Cube
 
08.11.12
13:22
(0) Ещё вариант - двухмерный штрихкод.
59 mzelensky
 
08.11.12
13:23
(57) "А за несоответствие бумаги с электронным вариантом уже несет ответственность тот, кто передавал" - я не хочу в ручную это проверять! Это должна сделать программа. Получить файлик, сверить, обрабоать и положить док с печатью в нужную папочку!

Ну что я тебе как ребенку объясняю!
60 Rebelx
 
08.11.12
13:25
(0) попробуй рыть в сторону "ИзвлечениеТекста" от 1С
61 mzelensky
 
08.11.12
13:25
Короче, народ начинает херью страдать.
Тему можно закрывать.
62 Gantosha
 
08.11.12
13:25
а я ауди А8 хочу .. могу описать как выглядит.
63 mzelensky
 
08.11.12
13:26
(60) Откуда? из картинки?
64 mzelensky
 
08.11.12
13:26
(62) Давай 5 лямов - подгоню!
65 Gantosha
 
08.11.12
13:26
товарищу тут за 3 предлагали , ..
66 Gantosha
 
08.11.12
13:27
но дело в том что что то мне не хватает .. даже на 3 .. и даже на ауди 4, но по теме все написали. Файнридер и дальше рыть что он может.
67 mzelensky
 
08.11.12
13:29
(65) И что? Мы ж не о товарище говоримЮ а о "а я ауди А8 хочу .. могу описать как выглядит".

Как было сказано в (20):

"Хорошие, качественные вещи стоят денег. Нищеброды могут нанимать таджиков за копейки дла обработки документов. Нормальные конторы понимают эффективность подобных систем и готовы платить за них деньги"

нищеброды на А8 не ездят!
68 mzelensky
 
08.11.12
13:29
(66) Есть и другйо вариант, но это уже "совсем другая история" :)
69 Gantosha
 
08.11.12
13:30
(67) ну вот я и говорю, что нищеброды нанимают таджиков .. просто с другой стороны захожу.