Графика

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Графика » Остальные программы » Скрипты и регэкспы часть II


Скрипты и регэкспы часть II

Сообщений 121 страница 150 из 451

1

Топик по скриптам, регэкспам и прочим полезным вещам в практике книгоделов.

Полезности
Перенумератор ссылок в FB2 файлах (читать READ ME!)
PopChar 5.5.2 для вставки любых символов в текст (портабельная)
CompareIt! 4.2.2221 для сравнения двух файлов (портабельная)
ACDSee 5 самый маленький и быстрый вьюер/редактор для основных типов графики (портабельный)
Scholar 1.0 + ORFO 2010 portable
Scholar 1.0.2 portable (если нужно, то ORFO 2010 берется из ссылки выше)

Отредактировано GMAP (2013-05-08 18:55:20)

121

Итак:   Улучшение второй версии третьего наблюдателя

В файле Spotter3.ini меняем BookPath в секции [PATH] под собственное дерево папок:

[PATH]
BookPath=D:\

Случай "Подозрительный фрагмент текста!" вынесен под спойлер (при Show=1):

[WARNING]
Show=1

Касательно этой формулировки (в дополнении к уже сказанному), можно заметить, что ПЧ-11
может ОДИНАКОВО распознать случай (например):

один абзац - 9-ть строк
либо
- 1-й абзац - одна строка + 2-й абзац - восемь строк
либо
- 1-й абзац - восемь строк + 2-й абзац - одна строка
либо
- 1-й абзац - пять строк + 2-й абзац - четыре строки

- иными словами зацепиться не за что.

Но, книга на книгу не приходится. Подобное встречалось в книгах Уинслоу - "Особо опасные" и
Бочоришвили - "Голова моего отца" - описание было здесь: Скрипты и регеспы в сообщении 438 от 2012-09-28 14:02:5
(Всё физически проверить сложно.) Но можно заключить, что если в протоколе Наблюдателя встречаються
в т.ч. формулировки: "Подозрительный фрагмент текста! / Разрыв абзаца" - выделено красными символами,
то скорее всего несколько из "Подозрительный фрагмент текста!" таки на самом деле - слипшиеся абзацы.
Если в протоколе формулировки: "Подозрительный фрагмент текста! / Разрыв абзаца" отсутствуют,
то скорее всего проверять ""Подозрительный фрагмент текста!" необходимости нет.

Я внятен?!

122

Уже лучше. :)
Разрывы абзацев страницей все нашёл.

Зато не нашёл ни одного разрыва абзаца на точке:

стр. 162

8/38              — В знак благодарности. Потому что теперь я читаю.

9/38            Почти читаю.

стр. 238

6/38              Послышались чьи-то шаги. Они были уже не одни.

7/38            Две женщины рассматривали блюда, покрытые соляной
8/38            глазурью.

стр. 261

6/35               Это прозвучало как утверждение, а не как вопрос.

7/35            Надо же хотя бы закинуть удочку.

стр. 275

21/37               Теперь они шли, держась за руки. Как другие пары.

22/37            Как молодой человек и девушка впереди них, как вон та
23/37            пара, уже не молодая, может быть, супруги. Все измени-
24/37            лось за несколько секунд из-за того, что было сказано,
25/37            из-за того, что было сделано.

******************
Учитывая, что именно этот случай стал побудительной причиной написания скрипта...  :dontknow:

123

Приветствую! http://fludu.h1.ru/Smiles/sm405.gif

именно этот случай стал побудительной причиной написания скрипта...

- досадная оплошность!
Устранил, заодно кое-что подчистил.
Вечером выложу очередное "улучшение". http://fludu.h1.ru/Smiles/yes3.gif
Естть предложение впредь именовать архивы не author_for_Alex2l, а вместо "for_Alex2l" - название произведения (можно сокращённо).

124

Alex2L написал(а):

Естть предложение впредь именовать архивы не author_for_Alex2l, а вместо "for_Alex2l" - название произведения (можно сокращённо).

Я подумаю. Мне надо как-то различать архивы, которые я храню.
А почему бы тебе просто не переименовать полученный архив? ;)

125

Да я их переименовываю, иногда. Просто - как будет, ежели автор повториться? А я не замечу? Упадёть всё в одну кучу.  http://fludu.h1.ru/Smiles/sad.gif Потом разбирайся. Нервничай.  http://fludu.h1.ru/Smiles/acute.gif

126

http://fludu.h1.ru/Smiles/secret.gif  Третье улучшение второй версии третьего наблюдателя

127

У меня сейчас в работе не слишком типичный пример книги. Очень много потерянных точек, в т.ч. в конце абзаца. Поэтому огромное количество сообщений о "неожиданном конце абзацев". По этой книге выводы делать не стоит.

Из замеченного:
- хотелось бы выделить тоже красным сообщение "возможно разрыв абзаца"
- многие сноски (распознанные как сноски) детектируются "потерянная сноска?"; их или не нужно вовсе детектировать, или поменять текст сообщения на "потерянный текст"
- сообщение о разрыве абзаца страницей приводит на следующую страницу, тогда как раньше приводило на предыдущую (с точкой в конце); сейчас приходится вернуться на предыдущую, чтобы убедиться, что это действительно разрыв абзаца

В одном месте  не распознан разрыв абзаца (стр. 329 - пометка для себя). Если захочешь, пришлю файлы, хотя, повторюсь, книга абсолютна не типична.

128

Мой почтение! http://fludu.h1.ru/Smiles/sm405.gif
Лучше прислать!

В протоколе к книге Пенелопа Лайвли "Как все это начиналось" обнаружилось упущение   http://fludu.h1.ru/Smiles/sad.gif  (на 164-й бумажной странице):

Стр. док.  — Возможно разрыв абзаца!
13/38              У Антона нет времени на раздумья. Не очень-то по-
14/38            размыслишь, когда занят тяжелым физическим трудом.
<разрыв>
15/38            А когда ои не на работе, времени все равно не выкроить.
<разрыв>
16/38            Надо же читать, спать, на все обращать внимание. Да и
17/38            обстановка там, где он живет, не очень располагает к раз-
18/38            мышлениям: телевизор, игра в карты, пиво, постоянное
19/38            подтрунивание друг над другом. Но Антон каждый день
20/38            ухитряется находить убежища, в которые можно спря-
21/38            таться на пару минут и насладиться ощущением больших
22/38            возможностей. Правильно, что он приехал сюда. Еще не-
23/38            много — и можно будет претендовать на настоящую ра-
24/38            боту. Подумать только, ведь уже весна, почти лето. Как
25/38            солнце светит!

- заштопал. По-идеи вечером выложу исправление.

По-поводу "потерянная сноска?" - имеется в виду, что текст похож на сноску, но в итоговый файл (FB2) не попадает.
Так что - попадает?! http://fludu.h1.ru/Smiles/wacko2.gif

Я внятен?!

129

Alex2L написал(а):

По-поводу "потерянная сноска?" - имеется в виду, что текст похож на сноску, но в итоговый файл (FB2) не попадает.
Так что - попадает?! http://fludu.h1.ru/Smiles/wacko2.gif
Я внятен?!


Не очень.  :glasses:
Выделенные под этим сообщением строки распознаны как сноска. Почему они не должны попадать в файл?
Проблемы бывают со сносками, распознанными как колонтитул. Со сносками, распознанными как сноски, проблем нет. Ну, или я их не встречала.

Файлы

130

Почему они не должны попадать в файл?

- проблема в том, что в HTM-файл они не попадают. Почему?! http://fludu.h1.ru/Smiles/dntknw.gif
Из чего делается вывод - коли не попало в HTM-файл, не факт, что попадёт в FB2-файл. О чём и сигналит. На всякий случай.
Если сигналить не нужно  http://fludu.h1.ru/Smiles/pardon.gif - отключу!

Я внятен?

131

Четвёртое улучшение второй версии третьего наблюдателя  http://fludu.h1.ru/Smiles/yes3.gif
Частично учтены пожелания.

132

Alex2L написал(а):

проблема в том, что в HTM-файл они не попадают. Почему?!

Хороший вопрос. Не знаю.

Наверное, отключать не нужно: для тех, кто разрешает ФР самому расставлять сноски, полезная информация. Но если можно, добавь её в выбор спойлер/не спойлер.
Потому что тем, кто расставляет сноски сам, эта информация ни к чему.

Новый скрипт проверю на следующей книге. Спасибо.

133

для тех, кто разрешает ФР самому расставлять сноски

- а гиде энто разрешается?

кто расставляет сноски сам, эта информация ни к чему

- не факт! С одной стороны - меньше напрягаться, выискавая сноски, с другой - эту информацию (из файла протокола) можно (при необходимости) copy-paste куда нужно, ИМХО, разумеется. http://fludu.h1.ru/Smiles/smile3.gif

добавь её в выбор спойлер/не спойлер

- эт можно, но о каких случаях речь? В принципе всё про сноски, про упущенные сноски, про сноски, которые не обозначены как сноски?

Новый скрипт проверю на следующей книге. Спасибо.

- взаимно! За сотрудничество!  http://fludu.h1.ru/Smiles/friends.gif

134

Alex2L написал(а):

а гиде энто разрешается?

Не поняла...
При экспорте в фб2 ФР сам расставляет сноски. Я ему не доверяю и расставляю сноски сама. За исключением случаев, когда книга документальная и сносок дофигища. Тогда я "разрешаю" ему самому расставить сноски, но потом контролирую.

Alex2L написал(а):

кто расставляет сноски сам, эта информация ни к чему

- не факт! С одной стороны - меньше напрягаться, выискавая сноски, с другой - эту информацию (из файла протокола) можно (при необходимости) copy-paste куда нужно, ИМХО, разумеется.


Факт.
Я переношу текст сноски к слову. Мне пофиг, как ФР поступил бы с ней самостоятельно. Такие перенесённые сноски остаются в тексте (в тех самых фигурных скобках, в которые я их поставила).
А какую информацию. куда и при какой необходимости бывает нужно перенести?

Alex2L написал(а):

о каких случаях речь?

"Потерянная сноска".
То есть, ФР распознал её как сноску, но при передаче в ХТМ "потерял".

Alex2L написал(а):

За сотрудничество!

http://fludu.h1.ru/Smiles/60e5b04866d90e6324fc14d0ab03e193.gif

135

Моё почтение! http://fludu.h1.ru/Smiles/sm405.gif

При экспорте в фб2 ФР сам расставляет сноски. Я ему не доверяю и расставляю сноски сама. За исключением случаев, когда книга документальная и сносок дофигища. Тогда я "разрешаю" ему самому расставить сноски, но потом контролирую.

- ладно, спрошу по-другому: как можно "запретить" ПЧ расставлять сноски про экспорте?!
Логично, если что-то можно "разрешить", то значит энто самое можно и запретить?! http://fludu.h1.ru/Smiles/sarcasticaa9.gif
Если идёть речь о том, что ПЧ что-то там расставит, а потом энту его работу похерить, да самостоятельно перерасставить, это понятно. Но называть энто "разрешить"?! http://fludu.h1.ru/Smiles/pardon.gif ИМХО, правильнее сказать - проигнорировать.

в тех самых фигурных скобках

- сам так делаю.

Под "информацией и имеется в виду текст сноски. Немного иная работа со Spotter-ом - не только в паре с ПЧ. Но это кому как удобно.

То есть, ФР распознал её как сноску, но при передаче в ХТМ "потерял".

- так она/они таки теряется? А те сноски, которые на самом деле сности, а ПЧ их сносками не обозначил, а Spotter порешил, что это всё таки сноски? Оставлять, как сейчас?

http://fludu.h1.ru/Smiles/secret.gif Вечером обновлю программу.

136

Ты меня окончательно запутал своими формулировками.  %-)
Беру тайм-аут.

137

Ты меня окончательно запутал своими формулировками

Я запутал?!  http://fludu.h1.ru/Smiles/swoon.gif

Беру тайм-аут.

Надолго?!
Если что - лучше дождатся вечера (около 18-00 каирского) и новой проги - исправлено несколько существенных упущений.

138

Как обещал:  пятое улучшение второй версии третьего наблюдателя

139

Забрала скрипт. Как проверю, отпишусь.

140

Новая книга.

стр. 13, 49 (2 места), 53, 65, 67, 69, 80, 88, 90 (2 места), 92, 109 и т.д.

Пример на стр. 13:

Подозрительный фрагмент текста! (в спойлере)

10/34                Однако какое-то время спустя все повторилось.
11/34            Он вновь вскочил, зажег свечу и подошел к двери.
12/34            Снова заперто! И снова внутри заворочался ужас-
13/34            ный голод. Отчего-то он не осмелился вновь позвать
14/34            хозяйку — вероятно, из-за чрезвычайной ее стран-
15/34            ности — и провел остаток ночи на стуле, взмокший
16/34            от пота, скрюченный.


Точка в конце строки. Может быть и склеенным. Такие места мне хотелось бы видеть без спойлера.

стр. 44-1 (ты изменил обозначения?)

Внимание на возможный разрыв абзаца страницей!

2/20            Чуть позже в комнату, что-то бормоча себе
3/20            под нос и волоча за собой щетку, приковы-
4/20            лял Джон Кейн, человек, которого я научилась
5/20            принимать, как и все остальное здесь, — то, что нель-
6/20            зя изменить, нужно приучиться выносить.


Это первый абзац на странице.
P.S. Вспомнила, что ты теперь указываешь на следующую страницу при разрыве. Тогда это, наверное, потому, что нет красной строки.

стр. 48, 69, 73, 179, 270, 307, 332, 352
Отлично отдетектированы "Очень подозрительный фрагмент текста!!!"  - слипшиеся абзацы. :cool:

стр. 70

Колонтитул?

Непонятно, по какому признаку. Указанный абзац распознан как основной текст.

стр. 241 - отлично найден разрыв абзаца на точке.  :cool:

на стр. 279 опять происходит что-то странное. По-моему, ты называл это "прыжками".

стр. 385

Вероятно сноска?!

Непонятно, по какому критерию. В первом случае абзац в центре страницы, распознан в стиле "Основной текст".
Все остальные - то же самое.

Файлы

141

Моё почтение! http://fludu.h1.ru/Smiles/sm405.gif

Уже писал - книга-книге рознь. "Подозрительный фрагмент текста!" - в подавляющем большинстве случаев - ложная тревога. Смотреть не на что!
Да, но в этой книге (раньше писал), высока вероятность того, что в некоторых случаях (по-видиму в 2-3-х) действительно окажется слипшийся (может даже троекратно) абзац. Заранее не угадаешь, нужно ли прятать под спойлер. Хотя может, ежли крепко подумать и можно что-то придумать. http://fludu.h1.ru/Smiles/dntknw.gif
Но, коли есть желание - ничего проще - при старте программы на этой закладке (Подозрительный фрагмент текста!) "тыцнуть" опцию Включать - будут НЕ ПОД спойлером.
Случай на стр. 44 - ложный сигнал. Полагаю, поправимо.
Стр. 70 - Колонтитул. Там из-за другого такое вылезло. Аналогично (полагаю, поправимо.), но надо поразмышлять.
стр. 279  - не готов сейчас комментировать. Какая-то ерунда приключилась. Бум бороть! Поборем. http://fludu.h1.ru/Smiles/yes3.gif
стр. 385 - Опять же - бум бороть! С предсказуемым результатом. Но надо поразмышлять.
Хорошая книга попалась!
Отдельное гран-мерси за названия архивов! http://fludu.h1.ru/Smiles/thank_you.gif

Полагаю внятен!?
Удачи!

142

Alex2L написал(а):

Полагаю внятен!?

Вполне.

Alex2L написал(а):

Отдельное гран-мерси за названия архивов!

Всегда пожалуйста. :)

143

Моё почтение! http://fludu.h1.ru/Smiles/sm405.gif

http://fludu.h1.ru/Smiles/secret.gif  шестое улучшение второй версии третьего наблюдателя

(В рамках замечаний к Себастьян Барри "Скрижали судьбы")

стр. 13, 49 (2 места), 53, 65, 67, 69, 80, 88, 90 (2 места), 92, 109 и т.д.
...
Точка в конце строки. Может быть и склеенным. Такие места мне хотелось бы видеть без спойлера.

- удержание левой клавиши Ctrl во время "тынцынья" по спойлеру - раскрывает/схлопывает однотипные спойлеры в групповом режиме.

на стр. 279 опять происходит что-то странное. По-моему, ты называл это "прыжками".

- "прыжки" остались кошмаром 1-й версии. Здесь банальный недочёт. Устранил.

Поправлены и другие замеченные ошибки и упущения.
Остальное требует более детального анализа и размышлений.

Я внятен?

144

Alex2L написал(а):

- удержание левой клавиши Ctrl во время "тынцынья" по спойлеру - раскрывает/схлопывает однотипные спойлеры в групповом режиме.

Круто!  :cool:
Спасибо.

Буду пробовать. Отпишусь.

145

Новая книга. Замечаний особых нет.

Разве что приходится возвращаться на одну страницу назад, чтобы проверить, действительно ли это разрыв абзаца страницей на точке, а потом опять листать одну страницу вперёд.
Но это уже косметика.

146

Приветствую!  http://fludu.h1.ru/Smiles/sm405.gif
седьмое улучшение второй версии третьего наблюдателя
- устранены замечания по крайней известной мне книге. http://fludu.h1.ru/Smiles/yes3.gif

Листать на возможном разрыве абзаца страницей приходится почти всегда. Не ясна суть проблемы! http://fludu.h1.ru/Smiles/dntknw.gif
Сейчас выглядит так:
Стр. док. [44/-1] — Внимание на возможный разрыв абзаца страницей!
за которым следует абзац (либо вторая половина его) на странице (к примеру 44). Нажатие на кнопку с последующим переходом в ПЧ и нажатия соответствующих кнопок там ведёт к попаданию на страницу документа 43 (в данном случае) . Затем, да, смотрим что там внизу страницы, листаем. И что-то для себя решаем.
Что означает "опять":

опять листать одну страницу вперёд

- неясно?! http://fludu.h1.ru/Smiles/dntknw.gif
напомню - раньше было просто типа:
Стр. док. [44] - т.е. попадали на страницу 44, смотрели что видим. Затем листали назад - смотрели. Если надо, что-то отмечали.
Так понял, что хотелось бы чтобы переделал,

- сообщение о разрыве абзаца страницей приводит на следующую страницу, тогда как раньше приводило на предыдущую (с точкой в конце); сейчас приходится вернуться на предыдущую, чтобы убедиться, что это действительно разрыв абзаца

как вот сейчас стало. Снова не так?!

Удачи!

147

Alex2L написал(а):

- неясно?!

Что именно неясно?

Я вижу сообщение, в котором фигурирует стр. 44.
Я иду на стр. 44.
Самый первый абзац начинается НЕ с красной строки. Это может быть разорванный абзац, а может быть, особенностью вёрстки, когда после пустой строки абзац начинается без отступа. Чтобы это выяснить, я должна пролистать одну страницу назад, посмотреть, как выглядит последняя строка на стр. 43, потом вернуться на стр. 44 и поставить служебный знак, обозначающий "разрыв абзаца".

Раньше сообщение такого рода приводило меня на стр. 43, где я видела сразу последнюю строку, и, если она занимала полную строку, то с большой вероятностью можно было предположить, что абзац разорван. Я листала одну страницу вперёд, и, если было нужно, ставила служебный знак.

Я, конечно, могу привыкнуть идти в ФР на стр. №(n-1), но, поскольку раньше было возможно было в протоколе указывать стр. 43 (условно, то, что я называю "предыдущей"), я предположила, что это должно быть не очень сложно.

За новую версию спасибо. Потестирую.

148

Я иду на стр. 44.
Самый первый абзац начинается НЕ с красной строки. Это может быть разорванный абзац, а может быть, особенностью вёрстки, когда после пустой строки абзац начинается без отступа. Чтобы это выяснить, я должна пролистать одну страницу назад, посмотреть, как выглядит последняя строка на стр. 43, потом вернуться на стр. 44 и поставить служебный знак, обозначающий "разрыв абзаца".


- эта... служебный знак, обозначающий "разрыв абзаца" можно ставить и в середину этого самого абзаца, pourquoi бы и не pas?! Разрыв шаблона!  http://fludu.h1.ru/Smiles/good.gif
Правда кто к чему привык. http://fludu.h1.ru/Smiles/pardon.gif
Фигурирует стр. 44 - т.к. проблема возникла НА ЭТОЙ странице. Потому и сделал - скакнули на ЭТУ страницу - поглядели - порешали - стоит-ли листать назад. Если стоит - отлистали, посмотрели что к чему (и может поставили пометку). Voilà!

И потом - что значит:

Я иду на ...


Номер страницы оформлен в виде книпки. Нажимаем кнопку - в буфер обмена попадает номер. (Или в данном случае номер-1)
По  Alt + Tab - перключаемся в ПЧ. Нажимаем там Ctrl + G, хрясаем Shift + Ins (или Ctrl + V), потом Enter - и мы на нужной странице документа.
Так изначально задумывалось и удобнее, ИМХО, чем просто так листать взад-вперёд, тихо при этом матерясь. http://fludu.h1.ru/Smiles/sarcasticaa9.gif

что это должно быть не очень сложно.

- а кито говорит "сложно"?! Нужен в ЭТОМ случае предыдущий номер? Можно сделать.  http://fludu.h1.ru/Smiles/yes3.gif

Я внятен?!

149

Alex2L написал(а):

просто так листать взад-вперёд, тихо при этом матерясь.

Я произвожу впечатление человека, листающего проект ФР постранично?
Я номер страницы не копирую из протокола, мне легче ввести его в поле Ctrl+G.

Насчёт служебных пометок - поверь мне, выработанная с годами система имеет свои причины.

Alex2L написал(а):

Нужен в ЭТОМ случае предыдущий номер? Можно сделать.

"Нужен" - неправильное слово. Было бы удобнее.
Спасибо.

150

Моё почтение!http://fludu.h1.ru/Smiles/sm405.gif

Я произвожу впечатление человека, листающего проект ФР постранично?

- так я эта... не ясновидящий!  http://fludu.h1.ru/Smiles/nea.gif
Вот я - произвожу впечатление человека, ковыряющего пальцем в носу?! http://fludu.h1.ru/Smiles/blush2.gif  http://fludu.h1.ru/Smiles/secret.gif А ведь, иногда...  http://fludu.h1.ru/Smiles/sarcasticaa9.gif

поверь мне, выработанная с годами система имеет свои причины

- верю. Так за последний год, системв немного поменялась? Имею в виду Spotter-ы? Вот интересно - раньше использовался и старый (VBS-ный) и первая версия Наблюдателя одноврененно + глазками. А как сейчас проверяется?
Приёмы проверки OCR - не догма, а руководство к действию! http://fludu.h1.ru/Smiles/derisive.gif
Удобство организую вечером. В версии 7а.


Вы здесь » Графика » Остальные программы » Скрипты и регэкспы часть II