:: Visual Foxpro, Foxpro for DOS
PDF
tata

Сообщений: 3460
Откуда: Казань
Дата регистрации: 23.10.2005
Что-то не придумывается ничего на ночь глядя.
Есть PDF-файл, который называется (пример) ОТЗЫВ СУММ_04542.pdf, это ответ на наш файл PFR-......-04542.XML.
04542 - номер документа, 5 знаков.
Шарить по диску, отыскивая такой номер пачки, весьма затратно по времени, потому что XML-файлов на диске... много, короче.
Было бы быстрее, если бы можно было прочитать номер района, а он, к сожалению, только в текстовом виде внутри PDF-файла.
Как бы оттуда выцепить район?
Есть идеи? Поиском ничего не нашла, наверное потому, что поиск по 3 знакам не прокатывает.
Ratings: 0 negative/0 positive
Re: PDF
of63

Сообщений: 25254
Откуда: Н.Новгород
Дата регистрации: 13.02.2008
на шару пробовала? прочитать PDF-файл ка обычный бинарный, и там поискать желаемое?
... и не пудри мозг: "потому что XML-файлов на диске... много, короче. "

Доб. Аа... У Тани такая конструкция.- Ей приходят XML-тексты, один из XML-тегов есть PDF-текст. Вобщем, не важно сильно. В конечномсчете есть PDF-файл. В нем, в ПДФ-тесте нужно что-то найти... (я правильно интерпретировал?)



Исправлено 1 раз(а). Последнее : of63, 17.03.19 22:31
Ratings: 0 negative/0 positive
Re: PDF
tata

Сообщений: 3460
Откуда: Казань
Дата регистрации: 23.10.2005
of63
на шару пробовала? прочитать PDF-файл ка обычный бинарный, и там поискать желаемое?
... и не пудри мозг: "потому что XML-файлов на диске... много, короче. "
Пробовала поиском найти - не находится, внутри 17 район...
Что значит - не пудри? Ты ведь даже понятия не имеешь, сколько их там.
Ratings: 0 negative/0 positive
Re: PDF
tata

Сообщений: 3460
Откуда: Казань
Дата регистрации: 23.10.2005
of63
на шару пробовала? прочитать PDF-файл ка обычный бинарный, и там поискать желаемое?
... и не пудри мозг: "потому что XML-файлов на диске... много, короче. "

Ей приходят XML-тексты, один из XML-тегов есть PDF-текст. Вобщем, не важно сильно. В конечномсчете есть PDF-файл. В нем, в ПДФ-тесте нужно что-то найти... (я правильно интерпретировал?)
Нет, немного не так. Мы посылаем XML, а в ответ приходит PDF, без номера района, но номер района есть внутри PDF. Вот как бы его оттуда достать?



Исправлено 1 раз(а). Последнее : tata, 17.03.19 22:34
Ratings: 0 negative/0 positive
Re: PDF
of63

Сообщений: 25254
Откуда: Н.Новгород
Дата регистрации: 13.02.2008
В Нортоне (F3) посмотри устройство этих ПДФ, не сильно важно что там к чему, но тексты там явно видны
Ratings: 0 negative/0 positive
Re: PDF
tata

Сообщений: 3460
Откуда: Казань
Дата регистрации: 23.10.2005
Ошибаешься. Может, там и есть тексты, но ничего непонятно.

xњ]’AnЫ@ Eч:…n`‘Г$`p“lІ
Что-то вроде такого.)
Ratings: 0 negative/0 positive
Re: PDF
of63

Сообщений: 25254
Откуда: Н.Новгород
Дата регистрации: 13.02.2008
Там все понятно. В чем смысл ПДФ. Текст там должен быть! И он есть. Но это не штатный способ. Ты хочешь только штатно? )
Ratings: 0 negative/0 positive
Re: PDF
ssa

Сообщений: 13007
Откуда: Москва
Дата регистрации: 23.03.2005
of63
Там все понятно. В чем смысл ПДФ. Текст там должен быть!
С чего бы это? Особенно если вся страница - одна картинка.
Цитата:
И он есть.
Мечтать не вредно.

------------------
Лень - это неосознанная мудрость.
Ratings: 0 negative/0 positive
Re: PDF
of63

Сообщений: 25254
Откуда: Н.Новгород
Дата регистрации: 13.02.2008
Давай твое правильное решение, чё )

Доб (Сам читаю каритнки, того же Ландау и Лифшица - куй найдешь текст, фоток (PDF) текста - докуя. Это рассия, детка ))



Исправлено 1 раз(а). Последнее : of63, 17.03.19 23:56
Ratings: 0 negative/0 positive
Re: PDF
of63

Сообщений: 25254
Откуда: Н.Новгород
Дата регистрации: 13.02.2008
Таня, ищи хоть ближайший, понятный тебе "идеал"...
Ratings: 0 negative/0 positive
Re: PDF
ssa

Сообщений: 13007
Откуда: Москва
Дата регистрации: 23.03.2005
of63
Давай твое правильное решение, чё )
|А почему решил, что у оно есть? В общем-то, этот формат совершенно не рассчитан на ковыряние в его внутренностях.

------------------
Лень - это неосознанная мудрость.
Ratings: 0 negative/0 positive
Re: PDF
tata

Сообщений: 3460
Откуда: Казань
Дата регистрации: 23.10.2005
ssa
of63
Давай твое правильное решение, чё )
|А почему решил, что у оно есть? В общем-то, этот формат совершенно не рассчитан на ковыряние в его внутренностях.
Получается, решение может быть только организационным. Буду писать письмо Почте России с просьбой изменить наименование файла.
Так получается, раз технического решения проблема не имеет.
Ratings: 0 negative/0 positive
Re: PDF
Taran

Сообщений: 13624
Откуда: Красноярск
Дата регистрации: 16.01.2008
tata
Есть PDF-файл, который называется (пример) ОТЗЫВ СУММ_04542.pdf, это ответ на наш файл PFR-......-04542.XML.
04542 - номер документа, 5 знаков.
....
Было бы быстрее, если бы можно было прочитать номер района, а он, к сожалению, только в текстовом виде внутри PDF-файла.

А в ваших исходных данных разве нету номера района?
PDF вы же получаете именно как ответ на ваш запрос. И номер документа присутствует в названии обоих файлов.
Т.е. от номера вернуться к исходному адресату и району.
Ratings: 0 negative/0 positive
Re: PDF
akvvohinc

Сообщений: 4219
Откуда: Москва
Дата регистрации: 11.11.2008
tata
Шарить по диску, отыскивая такой номер пачки, весьма затратно по времени, потому что XML-файлов на диске... много, короче.
Сотни тысяч? Миллионы?
Если нет, то сколько времени занимает у вас такой поиск?
Вряд ли эти XML-файлы могут находиться на диске где угодно, скорее всего, хотя бы корневая папка известна.
Ratings: 0 negative/0 positive
Re: PDF
andrewk
Автор

Сообщений: 174
Откуда: Красноярск
Дата регистрации: 15.05.2005
PDF – штука закрытая. Даже если прямо сейчас удастся что-то там расковырять, у людей через месяц обновится прога, с помощью которой они формируют эту pdf-ку, и всё может сломаться. Или кому-нибудь придёт в голову какое-нибудь шифрование включить.

tata
Есть PDF-файл, который называется (пример) ОТЗЫВ СУММ_04542.pdf, это ответ на наш файл PFR-......-04542.XML.
04542 - номер документа, 5 знаков.
Как бы оттуда выцепить район?
Это по взаимной договорённости – последние 5 символов от имени файла? Попробовать договориться, чтоб брали не 5 с конца, а всё, что после второго дефиса. Тогда в имя можно будет зашить и район и в будущем ещё что-нибудь.

Насчёт много файлов. Ну они ж наверняка не по всем дискам раскиданы. Попытаться какую-то структуру хранения придумать. Если там реально сотни или десятки тысяч файлов, которые должны храниться «вечно», то задача, наверное, предполагает какую-то каталогизацию.

А при формировании исходного xml-файла не получится запоминать "номер документа" – "район" (ну или что там ещё надо)?
Ratings: 0 negative/0 positive


Извините, только зарегистрированные пользователи могут оставлять сообщения в этом форуме.

On-line: 19 (Гостей: 19)

© 2000-2024 Fox Club 
Яндекс.Метрика