tata Сообщений: 3460 Откуда: Казань Дата регистрации: 23.10.2005 |
Что-то не придумывается ничего на ночь глядя.
Есть PDF-файл, который называется (пример) ОТЗЫВ СУММ_04542.pdf, это ответ на наш файл PFR-......-04542.XML. 04542 - номер документа, 5 знаков. Шарить по диску, отыскивая такой номер пачки, весьма затратно по времени, потому что XML-файлов на диске... много, короче. Было бы быстрее, если бы можно было прочитать номер района, а он, к сожалению, только в текстовом виде внутри PDF-файла. Как бы оттуда выцепить район? Есть идеи? Поиском ничего не нашла, наверное потому, что поиск по 3 знакам не прокатывает. |
Re: PDF | |
---|---|
of63 Сообщений: 25254 Откуда: Н.Новгород Дата регистрации: 13.02.2008 |
на шару пробовала? прочитать PDF-файл ка обычный бинарный, и там поискать желаемое?
... и не пудри мозг: "потому что XML-файлов на диске... много, короче. " Доб. Аа... У Тани такая конструкция.- Ей приходят XML-тексты, один из XML-тегов есть PDF-текст. Вобщем, не важно сильно. В конечномсчете есть PDF-файл. В нем, в ПДФ-тесте нужно что-то найти... (я правильно интерпретировал?) Исправлено 1 раз(а). Последнее : of63, 17.03.19 22:31 |
Re: PDF | |
---|---|
tata Сообщений: 3460 Откуда: Казань Дата регистрации: 23.10.2005 |
Пробовала поиском найти - не находится, внутри 17 район... Что значит - не пудри? Ты ведь даже понятия не имеешь, сколько их там. |
Re: PDF | |
---|---|
tata Сообщений: 3460 Откуда: Казань Дата регистрации: 23.10.2005 |
Нет, немного не так. Мы посылаем XML, а в ответ приходит PDF, без номера района, но номер района есть внутри PDF. Вот как бы его оттуда достать? Исправлено 1 раз(а). Последнее : tata, 17.03.19 22:34 |
Re: PDF | |
---|---|
of63 Сообщений: 25254 Откуда: Н.Новгород Дата регистрации: 13.02.2008 |
В Нортоне (F3) посмотри устройство этих ПДФ, не сильно важно что там к чему, но тексты там явно видны
|
Re: PDF | |
---|---|
tata Сообщений: 3460 Откуда: Казань Дата регистрации: 23.10.2005 |
Ошибаешься. Может, там и есть тексты, но ничего непонятно.
xњ]’AnЫ@Eч:…n`‘Г$`p“lІ Что-то вроде такого.) |
Re: PDF | |
---|---|
of63 Сообщений: 25254 Откуда: Н.Новгород Дата регистрации: 13.02.2008 |
Там все понятно. В чем смысл ПДФ. Текст там должен быть! И он есть. Но это не штатный способ. Ты хочешь только штатно? )
|
Re: PDF | |
---|---|
ssa Сообщений: 13007 Откуда: Москва Дата регистрации: 23.03.2005 |
С чего бы это? Особенно если вся страница - одна картинка. Цитата:Мечтать не вредно. ------------------ Лень - это неосознанная мудрость. |
Re: PDF | |
---|---|
of63 Сообщений: 25254 Откуда: Н.Новгород Дата регистрации: 13.02.2008 |
Давай твое правильное решение, чё )
Доб (Сам читаю каритнки, того же Ландау и Лифшица - куй найдешь текст, фоток (PDF) текста - докуя. Это рассия, детка )) Исправлено 1 раз(а). Последнее : of63, 17.03.19 23:56 |
Re: PDF | |
---|---|
of63 Сообщений: 25254 Откуда: Н.Новгород Дата регистрации: 13.02.2008 |
Таня, ищи хоть ближайший, понятный тебе "идеал"...
|
Re: PDF | |
---|---|
ssa Сообщений: 13007 Откуда: Москва Дата регистрации: 23.03.2005 |
|А почему решил, что у оно есть? В общем-то, этот формат совершенно не рассчитан на ковыряние в его внутренностях. ------------------ Лень - это неосознанная мудрость. |
Re: PDF | |
---|---|
tata Сообщений: 3460 Откуда: Казань Дата регистрации: 23.10.2005 |
Получается, решение может быть только организационным. Буду писать письмо Почте России с просьбой изменить наименование файла. Так получается, раз технического решения проблема не имеет. |
Re: PDF | |
---|---|
Taran Сообщений: 13624 Откуда: Красноярск Дата регистрации: 16.01.2008 |
А в ваших исходных данных разве нету номера района? PDF вы же получаете именно как ответ на ваш запрос. И номер документа присутствует в названии обоих файлов. Т.е. от номера вернуться к исходному адресату и району. |
Re: PDF | |
---|---|
akvvohinc Сообщений: 4219 Откуда: Москва Дата регистрации: 11.11.2008 |
Сотни тысяч? Миллионы? Если нет, то сколько времени занимает у вас такой поиск? Вряд ли эти XML-файлы могут находиться на диске где угодно, скорее всего, хотя бы корневая папка известна. |
Re: PDF | |
---|---|
andrewk Автор Сообщений: 174 Откуда: Красноярск Дата регистрации: 15.05.2005 |
PDF – штука закрытая. Даже если прямо сейчас удастся что-то там расковырять, у людей через месяц обновится прога, с помощью которой они формируют эту pdf-ку, и всё может сломаться. Или кому-нибудь придёт в голову какое-нибудь шифрование включить.
Это по взаимной договорённости – последние 5 символов от имени файла? Попробовать договориться, чтоб брали не 5 с конца, а всё, что после второго дефиса. Тогда в имя можно будет зашить и район и в будущем ещё что-нибудь. Насчёт много файлов. Ну они ж наверняка не по всем дискам раскиданы. Попытаться какую-то структуру хранения придумать. Если там реально сотни или десятки тысяч файлов, которые должны храниться «вечно», то задача, наверное, предполагает какую-то каталогизацию. А при формировании исходного xml-файла не получится запоминать "номер документа" – "район" (ну или что там ещё надо)? |
© 2000-2024 Fox Club  |