:: Visual Foxpro, Foxpro for DOS
Re: djvu в image
kornienko_ru

Сообщений: 235
Откуда: Владивосток
Дата регистрации: 06.09.2015
Михаил,
спасибо за такой файл. Никогда бы такого не встретил. Вот, что значит выходить на общий форум.
Разобрался с проблемой. Все мои pdf и все примеры, которые я видел в разборках на разных форумах и ресурсах имеют уникальный объект Kids. Т.е. он один для всего файла. У вас же в файле AA.pdf их 3 шт. Не понятно почему.... страниц в файле у вас не так много.... зачем их помещать в разные объекты Kids? Видимо какое-то старое ПО используете для формирования pdf..... Ну раз мне такой файл попался, я предусмотрю такую ситуацию. Скорей всего сегодня обновлю prg.

Prg обновил. Там же на github.com, версия от 03.05.2024



Исправлено 1 раз(а). Последнее : kornienko_ru, 03.05.24 08:54
Ratings: 0 negative/1 positive
Re: djvu в image
lemenev

Сообщений: 136
Дата регистрации: 23.06.2022
Почему ваша программа «раздувает» файл? Вот статистика:
Исходный файл	  	Результирующий файл
 18 стр.   282 977 B		  2 стр.   286 124 B
435 стр. 7 583 983 B		435 стр. 7 774 641 B

И вот ещё один файл, на котором программа совсем не работает:
Ratings: 0 negative/0 positive
Re: djvu в image
kornienko_ru

Сообщений: 235
Откуда: Владивосток
Дата регистрации: 06.09.2015
Раздувание исправил. Дубликаты объектов записывались в случаях неотсортированных по порядку объектов. Но еще последний рывок надо сделать с раздвоением объекта Kids. Видимо в файле AA было когда-то такое своеобразное объединение двух pdf. Я напишу когда будет готово. Надо немного передохнуть, а то уже к старости мозги хуже работают.
Ratings: 0 negative/0 positive
Re: djvu в image
kornienko_ru

Сообщений: 235
Откуда: Владивосток
Дата регистрации: 06.09.2015
Михаил,
а фал CC.pdf Edge открывает только одну страницу с бланком Aliyah Fragebogen /Bitte nur vom Familienmitglied, der die jüdischen Wurzeln hat, ausfüllen. Так и должно быть? Есть подозрение, что этот файл испорчен.
Ratings: 0 negative/0 positive
Re: djvu в image
lemenev

Сообщений: 136
Дата регистрации: 23.06.2022
в этом файле одна страница.
Ratings: 0 negative/0 positive
Re: djvu в image
kornienko_ru

Сообщений: 235
Откуда: Владивосток
Дата регистрации: 06.09.2015
Обновил prg на github.com
C AA.dbf всё хорошо. С CC.dbf на досуге буду разбираться.
Ratings: 0 negative/0 positive
Re: djvu в image
lemenev

Сообщений: 136
Дата регистрации: 23.06.2022
kornienko_ru
Есть подозрение, что этот файл испорчен.
Файл не испорчен. Вместо &#252 идут буквы с умляутом (две точки над буквой). Возможно, у вас что-то с отображением европейских шрифтов.



Исправлено 1 раз(а). Последнее : lemenev, 03.05.24 21:19
Ratings: 0 negative/0 positive
Re: djvu в image
sphinx

Сообщений: 31402
Откуда: Каменск-Уральски
Дата регистрации: 22.11.2006
Вот с уважением к товарищу Леменеву. На форум пришол с вопросами, а ДУХ сайта понял. Понял верно. В какой-то теме мне интересно (или больше знаю) - код пишу. Не всегда идеально верный. Но спасибо коллеги мне говорили неоднократно (допилят идею, я даже не сомневаюсь).

Так и надо. Сделал/решил свою проблему - выложить не забудь. Коллегам порой тонны часов сэкономите. Тем, кто и ВАМ поможет, потратит свое время.

Мы коллеги и уважаем друг друга.


------------------
"Veni, vidi, vici!"(с)
Ratings: 0 negative/1 positive
Re: djvu в image
kornienko_ru

Сообщений: 235
Откуда: Владивосток
Дата регистрации: 06.09.2015
lemenev
Файл не испорчен. Вместо &#252 идут буквы с умляутом (две точки над буквой). Возможно, у вас что-то с отображением европейских шрифтов.
Я не про немецкие буквы. Это так отобразилось на форуме. Я про структуру pdf. В описательной части этого файла указано, что в нем 131 объект. А на самом деле я насчитал 8. Также замечу, что официальные просмоторщики при наличии ошибок в файле их восстанавливают и отображают корректно, хотя на самом деле они сбойные.
Как выяснилось по вашему CC.dbf cуществует 2 типа pdf. В одном типе перекрестные ссылки, которые я анализирую записаны в текстовом виде в десятичных числах. Этот тип широко распространен. А есть еще такой тип, где эти ссылки в двоичном представлении, как раз это имеет место в файле CC.dbf. Моя программа пока с такими работать не может. Возможно я этим займусь когда-либо, раз уж влез в эту тему. На сегодняшний день возникла идея доработать prg, чтобы при обращении без указания номеров страниц или с нулем, функция возвращала число страниц в этом pdf. Сегодня от 04.05.2024 сделаю такую опцию, обновлю.
Ratings: 0 negative/0 positive
Re: djvu в image
lemenev

Сообщений: 136
Дата регистрации: 23.06.2022
Для меня, как не специалиста по формату PDF, все PDF файлы «на одно лицо». И если никогда изначально не знаешь, будет ли программа обрабатывать очередной файл, то «так жить нельзя». Посылаю ещё один файл для тестирования.
Да, программа не выдаёт диагностику, если указанный файл не существует.
Ratings: 0 negative/0 positive
Re: djvu в image
kornienko_ru

Сообщений: 235
Откуда: Владивосток
Дата регистрации: 06.09.2015
Хорошо. Файл DD.pdf необычный, но первого типа. Я разберусь. Обновлюсь.
Ratings: 0 negative/0 positive
Re: djvu в image
kornienko_ru

Сообщений: 235
Откуда: Владивосток
Дата регистрации: 06.09.2015
lemenev
Для меня, как не специалиста по формату PDF, все PDF файлы «на одно лицо».
А вы думаете я специалист по формату PDF? Я тоже просто пользователь. За pdf я взялся неделю назад из любопытства. В своем разработанном комплексе по ТСЖ я формирую разные отчеты и квитанции, с помощью своего разработанного генератора отчетов, который я тут когда-то публиковал и здешние его качали и использовали (в генераторе задействован LibreOffice через COM) ... я только рад, несмотря на злыдней и завистников, которые меня критикуют и минусуют. И эти отчеты я сохраняю в pdf. Квитанции у меня на 1 лист. И для доступа к своей квитанции пользователя личного кабинета я извлекаю его лист из общего pdf с квитанциями. Вот для этой манипуляции мне это нужно было. Какие у вас цели я не знаю. Но всё идет вперёд, возможно LibreOffice тоже перейдет на новый формат новой версии pdf.

То что касается файла DD.pdf при более внимательном рассмотрении оказалось, что он 2-го типа. Возможно смешанного типа, как и AA.pdf — полученный из двух pdf. Этим я ввелся в заблуждение, что он 1-го типа. На следующей неделе я более пристально его изучу. Этот 2-ой тип появляется с версий pdf от 1.5 и выше.



Исправлено 1 раз(а). Последнее : kornienko_ru, 05.05.24 02:45
Ratings: 0 negative/0 positive
Re: djvu в image
sphinx

Сообщений: 31402
Откуда: Каменск-Уральски
Дата регистрации: 22.11.2006
Все придумано до нас:

www.foxypreviewer.com

А тут обсуждения по теме:
forum.foxclub.ru


------------------
"Veni, vidi, vici!"(с)




Исправлено 1 раз(а). Последнее : sphinx, 05.05.24 12:45
Ratings: 0 negative/0 positive
Re: djvu в image
kornienko_ru

Сообщений: 235
Откуда: Владивосток
Дата регистрации: 06.09.2015
Это не то.
Для меня то вопрос уже решен. Всё работает с файлами pdf версий до 1.4. То, что хотелось бы Михаилу с 1.5 версии..... я сделаю. Спецификация есть, формат понятен. В этом файле DD.pdf уже новый формат. Можно программу на нём откатать.
Ratings: 0 negative/0 positive
Re: djvu в image
kornienko_ru

Сообщений: 235
Откуда: Владивосток
Дата регистрации: 06.09.2015
Возникло небольшое осложнение с файлами CC.pdf и DD.pdf. Дело даже не столько в версии PDF выше 1.5, сколько в отсутствии в этих двух файлах доступа к таблице перекрестных ссылок в связи с их шифрованием. Честно говоря я не вижу смысла, чтобы зачем-то надо было шифровать эту таблицу, все равно эту таблицу можно построить полностью просмотрев весь файл... просто это будет работать дольше, особенно это станет заметно на очень больших по размеру файлах. Признак того, что таблицы зашифрованы, это наличие ключей "/Filter/FlateDecode" в словарях таблиц, которые указаны в обоих файлах и CC.pdf, и DD.pdf. Да и видно, внешне, что таблицы нечитаемы и плотно сжаты. В связи с этим вопрос — как вы считаете лучше заложить логику в программу pdfToStr(). Проанализировать весь файл, потратить время и выбрать нужные страницы или выдать результат в виде пустого файла? Как вариант можно снять шифровку с таблицы перекрестных ссылок перезаписав этот файл, а старый переименовать в BAK.

Вот что сказано в официальной спецификации: Beginning with PDF 1.5, embedded files may be encrypted in an otherwise unencrypted document (see Section 3.5.4, “Crypt Filters”).



Исправлено 4 раз(а). Последнее : kornienko_ru, 06.05.24 07:05
Ratings: 0 negative/0 positive
Re: djvu в image
lemenev

Сообщений: 136
Дата регистрации: 23.06.2022
Выдать результат в виде пустого файла – это расписаться в собственной беспомощности.
Перезаписывать исходный файл нельзя. Он может понадобиться в исходном виде в будущем.
Остаётся единственный предложенный вами вариант – создавайте временный файл, в котором снимайте шифровку с таблицы перекрестных ссылок, и выбирайте нужные страницы. Сколько при этом вы потратите времени – не существенно. Потом можно оптимизировать процесс.
Ratings: 0 negative/0 positive
Re: djvu в image
kornienko_ru

Сообщений: 235
Откуда: Владивосток
Дата регистрации: 06.09.2015
Хорошо. Красиво было бы в памяти создать xref без создания временного файла. Но подумал, что каждый раз при обращении к этому файлу, особенно, если он очень большой, будет тратиться каждый раз лишнее время. Поэтому думаю записать рядом с исходным файл с похожим именем с незашифрованной таблицей xref. Процедура построения xref получилась на 50 строк. Завтра её прикручу, отлажу, обновлюсь. Будет больше, чем 50. На ваших тестовых файлах всё работает быстро, замедления особо не заметно.
Ratings: 0 negative/0 positive
Re: djvu в image
akvvohinc

Сообщений: 4261
Откуда: Москва
Дата регистрации: 11.11.2008
kornienko_ru
Поэтому думаю записать рядом с исходным файл с похожим именем с незашифрованной таблицей xref.
Сомневаюсь, что кому-то понравится такой вариант, который оставляет "следы" на диске и даже не в temp-папке.
Ratings: 0 negative/0 positive
Re: djvu в image
sphinx

Сообщений: 31402
Откуда: Каменск-Уральски
Дата регистрации: 22.11.2006
akvvohinc
kornienko_ru
Поэтому думаю записать рядом с исходным файл с похожим именем с незашифрованной таблицей xref.
Сомневаюсь, что кому-то понравится такой вариант, который оставляет "следы" на диске и даже не в temp-папке.

Сергей, я тоже против. Но порой это проще в реализации, чем за "чистоту-всего-и-вся". Использование темповых каталогов не гнушаются даже монстры забугорного софта. Фоксисты, все же более ответственно относятся к ресурсам, месту, правам и пр. Сам такой.




------------------
"Veni, vidi, vici!"(с)
Ratings: 0 negative/0 positive
Re: djvu в image
of63

Сообщений: 25406
Откуда: Н.Новгород
Дата регистрации: 13.02.2008
Рядом с открываемым файлом оставлять свои следы - это не оч.хор. (как Эксели и Верд это делают - держат скрытые файлы открывающего, задолбали эти "скрытые" файлы с тильдами)

Можно в ТМП папке родного компа оставлять все что хочешь... (или в каком другом ТМП-месте) например, при первом открытии желаемого PDF оставлять файл его структуры (как вы его обозначили? "xref"?, хорошо), который имеет условленое имя (пусть сигнатура от имени целевого файла, типа SYS(2007, имя_файла_PDF))

Получится, что работая с этими сетевыми файлами на вашем компе, у вас будет в наличии готовый "xref". Недостаток этого метода - у соседа не будет... но можно скопировать.
() Всё устроено на файлах и памяти

Доб. Родного компа, и в моей родной учетной записи

Доб2. Хотя есть место и для общего для всех юзеров "мусора", типа, в винде, "C:\Program Data"



Исправлено 2 раз(а). Последнее : of63, 07.05.24 22:09
Ratings: 0 negative/0 positive


Извините, только зарегистрированные пользователи могут оставлять сообщения в этом форуме.

On-line: 16 (Гостей: 16)

© 2000-2024 Fox Club 
Яндекс.Метрика