:: Visual Foxpro, Foxpro for DOS
Re: Поиск строки символов в PDF файлах.
_vit
Автор

Сообщений: 5173
Дата регистрации: 29.07.2002
dimuhametov
_vit
Необходимо просканировать пару тысяч PDF файлов на наличие строки символов.
Пошарил в инете и что то ничего подходящего не нашел пока.
В найденых решениях либо использование платных библиотек а задача одноразовая так что тратиться нет резона,
либо управление UI Adobe Reader-а иммитацией нажатий клавиш что вобщем то не очень.
Может кто-то сталкивался с подобными решениями.
чет плохо искал www.experts-exchange.com

Не уверен но кажется что-то такое я пробовал.
Вроде как лицензия нужна платная на Adobe Reader.
Может и ошибаюсь, не помню точно. А код на работе.
Но в любом случае спасибо!
Ratings: 0 negative/0 positive
Re: Поиск строки символов в PDF файлах.
sphinx

Сообщений: 31166
Откуда: Каменск-Уральски
Дата регистрации: 22.11.2006
Может Медстрах что-то придумает, я ему ссылку на эту тему дал. У него есть время, постарается что-то подумать.


------------------
"Veni, vidi, vici!"(с)
Ratings: 0 negative/0 positive
Re: Поиск строки символов в PDF файлах.
_vit
Автор

Сообщений: 5173
Дата регистрации: 29.07.2002
sphinx
Вит, файло проблемный кинь, а. Вряд ли там супер-секретная информация. А предметнее, пощупать можно. И Дмитрий (po2) просил, и Сергей Сизов пощупал бы.

Не знаю не знаю...
У нас к каждому письму причепляется приписка
если типа письмо получили по ошибке, то вам не повезло.
И лучше сами удавитесь сразу, не сходя с места...
Ratings: 0 negative/0 positive
Re: Поиск строки символов в PDF файлах.
dimuhametov

Сообщений: 1562
Откуда: Костанай
Дата регистрации: 01.11.2008
_vit
dimuhametov
_vit
Необходимо просканировать пару тысяч PDF файлов на наличие строки символов.
Пошарил в инете и что то ничего подходящего не нашел пока.
В найденых решениях либо использование платных библиотек а задача одноразовая так что тратиться нет резона,
либо управление UI Adobe Reader-а иммитацией нажатий клавиш что вобщем то не очень.
Может кто-то сталкивался с подобными решениями.
чет плохо искал www.experts-exchange.com

Не уверен но кажется что-то такое я пробовал.
Вроде как лицензия нужна платная на Adobe Reader.
Может и ошибаюсь, не помню точно. А код на работе.
Но в любом случае спасибо!
никаких лицензий не надо, обычный "Windows Search"


------------------
Незнание делает жизнь такой интересной.
Ratings: 0 negative/0 positive
Re: Поиск строки символов в PDF файлах.
_vit
Автор

Сообщений: 5173
Дата регистрации: 29.07.2002
dimuhametov
никаких лицензий не надо, обычный "Windows Search"

И правда, по крайней мере объект loConn создался.

Надо поизучать Advanced Query Syntax.

Спасибо!
Ratings: 0 negative/0 positive
Re: Поиск строки символов в PDF файлах.
_vit
Автор

Сообщений: 5173
Дата регистрации: 29.07.2002
dimuhametov
_vit
Необходимо просканировать пару тысяч PDF файлов на наличие строки символов.
Пошарил в инете и что то ничего подходящего не нашел пока.
В найденых решениях либо использование платных библиотек а задача одноразовая так что тратиться нет резона,
либо управление UI Adobe Reader-а иммитацией нажатий клавиш что вобщем то не очень.
Может кто-то сталкивался с подобными решениями.
чет плохо искал www.experts-exchange.com

Попробовал. Из фокса Ничего не получилось.
Запрос возвращает пустой рекордсет даже если не фильтрую записи.

Для простоты сократил код

Local loConn, lcWSSQL, loRs
loConn = Createobject("adodb.connection")
loConn.ConnectionString = "Provider=Search.CollatorDSO;Extended Properties='Application=Windows';"
loConn.Open()
If (loConn.State = 1)
*lcWSSQL = "SELECT System.ItemFolderPathDisplay, System.Filename FROM SystemIndex WHERE CONTAINS('searchstring') AND System.FileExtension = '.pdf'"
lcWSSQL = "SELECT Top 5 System.ItemPathDisplay FROM SYSTEMINDEX"
loRs = loConn.Execute(lcWSSQL)
? loRs.RecordCount
loRs.Close()
loConn.Close()
Endif
Return

То же самое на С# работает. :al:
Но...
Тут много оговорок.
Во превых сервис индексирования должен быть настроен на индексацию папки с файлами.
Во вторых похоже pdf файлы не индексируются по содежимому. Перепробовал кучу разных pdf файлов ни один не удалось найти по содержимому.
Ratings: 0 negative/0 positive
Re: Поиск строки символов в PDF файлах.
Igor Korolyov

Сообщений: 34580
Дата регистрации: 28.05.2002
Нужно устанавливать фильтр. Кроме адобовского, был ещё фильтр и от авторов FoxIt - но тот кажись всегда платным был, и не дешёвым...

blog.techhit.com


------------------
WBR, Igor
Ratings: 0 negative/0 positive
Re: Поиск строки символов в PDF файлах.
_vit
Автор

Сообщений: 5173
Дата регистрации: 29.07.2002
Igor Korolyov
Нужно устанавливать фильтр. Кроме адобовского, был ещё фильтр и от авторов FoxIt - но тот кажись всегда платным был, и не дешёвым...
blog.techhit.com


Спасибо Игорь!

Установил адобовский фильтр и по крайней мере какие то файлы смог найти из программы на С#.
Завтра попробую на рабочих файлах.
Ratings: 0 negative/0 positive
Re: Поиск строки символов в PDF файлах.
dimuhametov

Сообщений: 1562
Откуда: Костанай
Дата регистрации: 01.11.2008
Можно через доступ к .NET из FoxPro с помощью wwDotnetBridge + iTextSharp по ссылке cloud.mail.ru передавать PDF в текстовый файл, и далее в нем искать строку символов.


------------------
Незнание делает жизнь такой интересной.
Ratings: 0 negative/0 positive
Re: Поиск строки символов в PDF файлах.
of63

Сообщений: 25161
Откуда: Н.Новгород
Дата регистрации: 13.02.2008
Конфиденциальность какую гарантируют?
Ratings: 0 negative/0 positive


Извините, только зарегистрированные пользователи могут оставлять сообщения в этом форуме.

On-line: 32 (Гостей: 32)

© 2000-2024 Fox Club 
Яндекс.Метрика