Графика

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Графика » Остальные программы » Скрипты и регеспы


Скрипты и регеспы

Сообщений 241 страница 270 из 1000

241

Alex2L написал(а):

А не рано выложили-то скрипт?!

Повторюсь: ошибки - не критичные.
Кроме того, похоже, желающих тестировать много не наберётся. :(

Новую версию забрала, попробую.

Давать новую ссылку в форуме на Л. или подождём ещё?
Я могу написать, что скрипт в процессе доработки. По-моему, это нормально.

242

Много-много лучше.  :cool:

На стр. 66 - согласна, ФР распознал без отступа. От сканировщика не зависит - это какой-то "плавающий" глюк. Предполагаю, что зависит от гарнитуры и вёрстки бумажной книги.

243

Моё почтение!

Давать новую ссылку в форуме на Л. или подождём ещё?
Я могу написать, что скрипт в процессе доработки. По-моему, это нормально.


Полностью на ваше усмотрение! :)

желающих тестировать много не наберётся.

- ну да. Насильно мил не будешь! :)

Если не составит труда, несколько оригиральных страниц типа 65-67 и в р-не главы 18-й скиньте, please!

244

Alex2L написал(а):

Если не составит труда, несколько оригиральных страниц типа 65-67 и в р-не главы 18-й скиньте, please!

Конечно. Сейчас выложу. :)

Вот, пожалуйста.

http://www.multiupload.nl/OEPXWDXJLN

Отредактировано golma1 (2012-09-04 11:44:05)

245

Alex2L написал(а):

Насильно мил не будешь!

Подумала, что всё дело в том, что большинство совершенно не заинтересовано в высоком качестве файлов. Поэтому и делают "как побыстрее". :(

246

Поэтому и делают "как побыстрее".


- халтурщики и разгильдяи!

А текст распознается почти везде так же - визуально - отступ, а ПЧ тулит без левого отступа, причем одинаково в разных форматах, даже при попытке копирования в буфер обмена.

Ладно, бум думать...

247

Alex2L написал(а):

А текст распознается почти везде так же - визуально - отступ, а ПЧ тулит без левого отступа, причем одинаково в разных форматах, даже при попытке копирования в буфер обмена.

Причём я за всё время так и не сумела скоррелировать с чем бы то ни было.  :dontknow:

248

Причём я за всё время так и не сумела скоррелировать с чем бы то ни было


по-видимо, раньше просто глаз за это абсолютно не цеплялся. Как там в одном из законов Мерфи - "неважно, что что-то идёт неправильно, возможно это хорошо выглядит." :)
Так вот и тут, глюк ПЧ, возможно связанный с тем, что первый символ на странице - Прописная. А может и нет.
Остаётся надеяться, что может в 12-й появится, например, "ползунок" отступа (a-la Word). Или енто хотя-бы поправят.

А над скриптом работа продолжится, вроде как "театр одного актёра для одного зрителя" :)

249

Alex2L написал(а):

вроде как "театр одного актёра для одного зрителя"

Если Вам это подходит, то мне и подавно. ;)
Вам - практика, мне - дополнительный инструмент.

Но если Вам это наскучит или покажется нерентабельным, пойму... :flirt:

250

Alex2L написал(а):

Так вот и тут, глюк ПЧ, возможно связанный с тем, что первый символ на странице - Прописная.

Это проявляется не только в начале страницы. На одной странице могут быть абзацы с отступом и без.  :dontknow:

251

Моё почтение!

Если Вам это подходит, то мне и подавно.
Вам - практика, мне - дополнительный инструмент.


Эт точно! (с)

А каков зритель! Сама королева! ;)
И не просто зритель, а активный соучастник пре... дставления.

Завершать работу со скриптом пока не планирую. По крайней мере, дождёмся
ПЧ-12, а там видно будет. Другое дело, учитывая, что скрипт в настоящий момент,
достаточно неплох, на первый взгляд, то новые версии, как "горячие пирожки" появляться
не будут. Количество обнаружений должно перерасти в качество, а это процесс кропотливый. Вдумчивый. "Торописса не надо!" (с)

Из того, что задумал:

1. Скрипт в т.ч. ловит разрывы абзаца, которые (как вы справедливо писали в форуме одной латино-американской страны) ловит скрипт ФБЕ. Отвлекать внимание (в моём скрипте), пожалуй, не стоит. Стало быть - под спойлер его! С иной формулировкой, и, скажем, зелёного цвета. Ну, чтобы, понятней было. :)

2. Если абзац начинается с диалога (первая тире), а следующий за ним - тоже диалог, то неважно, в каком месте в первом абзаце стоит в конце точка - диалог и баста! Не наш случай!
Верно? Долой ложные сработки!

3.

Это проявляется не только в начале страницы. На одной странице могут быть абзацы с отступом и без.

Не good, но ладно. Я же говорю, ладно. Если диалог - то отступ не важен - см. выше, если нет - смотрим где точка в конце абзаца, и уже в зависимости от этого - решаем, стоит ли "колотиться".

4. Сноски внизу страницы (тут ещё совсем не всё гладко, но поборю), тоже - под спойлер!
Скажем, красного цвета. (Ес-но с анализом предшествующего сноске(-ам) абзаца на разрыв).
Тут выгода в том, что ежели ПЧ при экспорте в FB2-формат сноску пропустит, то её, при желании, мона будет и из HTA-протокола "выципить". Кстати, если вдруг понадобиться, то в HTA-файлах работает "стандартный" поиск по Ctrl+F.
При обнаружении сноски спойлерить предполагаю целую страницу.

А пока это всё "переваривается" в голове, испытываю что-то типа "ломки" - охота сделать
новую книгу-файл. Оно и полезно - переключиться на что-то другое.

Так шта (с): Show must go on! (c)

Я эта... внятен?!

Отредактировано Alex2L (2012-09-05 09:37:57)

252

Приветствую.
Продолжаем наш концерт по заявкам. (с) http://fludu.h1.ru/Smiles/Laie_37.gif

Alex2L написал(а):

2. Если абзац начинается с диалога (первая тире), а следующий за ним - тоже диалог, то неважно, в каком месте в первом абзаце стоит в конце точка - диалог и баста! Не наш случай!
Верно? Долой ложные сработки!

Мммм... А если во втором абзаце (второй реплике) несколько строк и в конце первой стоит точка, на которой абзац разорван? Тогда в третьем (ложном) абзаце тире не будет.
Или этот случай в любом случае отработается?

Alex2L написал(а):

4. Сноски внизу страницы (тут ещё совсем не всё гладко, но поборю), тоже - под спойлер!
Скажем, красного цвета. (Ес-но с анализом предшествующего сноске(-ам) абзаца на разрыв).
Тут выгода в том, что ежели ПЧ при экспорте в FB2-формат сноску пропустит, то её, при желании, мона будет и из HTA-протокола "выципить". Кстати, если вдруг понадобиться, то в HTA-файлах работает "стандартный" поиск по Ctrl+F.
При обнаружении сноски спойлерить предполагаю целую страницу.

Целую страницу под спойлер - это много. Лучше уж отослать к ФР - типа "проверьте сноски на странице". Или последний абзац, "подозрительная" сноска и первый абзац следующей страницы.
Хорошо было бы "уверенные сноски" при анализе ситуации игнорировать. Если это вообще возможно.

Alex2L написал(а):

А пока это всё "переваривается" в голове, испытываю что-то типа "ломки" - охота сделать
новую книгу-файл. Оно и полезно - переключиться на что-то другое.

Всячески приветствую.  http://fludu.h1.ru/Smiles/friends.gif
Тем более, что скрипт на теперешнем этапе отлично работает, да и количество ложных срабатываний при нормальном распознавании абсолютно приемлемо.

За добрые слова спасибо.  http://fludu.h1.ru/Smiles/thank_you.gif

253

Мммм... А если во втором абзаце (второй реплике) несколько строк и в конце первой стоит точка, на которой абзац разорван? Тогда в третьем (ложном) абзаце тире не будет.
Или этот случай в любом случае отработается?


Безусловно отработается! Он же (тот второй) будет (в этом случае) "рваный".

Целую страницу под спойлер - это много.

- дак ведь спойлер. Посмотрим... Если что не так, поправим...
А сноски (любые) планирую под спойлер. Ну, уверенные мона выделить цветом, скажем фиолетовым или коричневым. Всё в "процессе". :)

254

Кстати о диалогах. Волею судьбы в свободное время читаю в данный момент
Пристли. Другое Место. Рассказы [Авторский сборник]
http://lib.rus.ec/b/383906

— Дайте мне сказать! — закричал Стив.

А ты помалкивай, — сказала мама. — Ты терпел его, это верно, но он ведь платил свою долю…

— Последнее время — не очень, — сказал папа. — Сначала он давал, что с него причиталось, когда цены были не такие сумасшедшие, а потом перестал. А всего-то двадцать три шиллинга в неделю.


Прочитал пока немного. Обнаружил пару орфографических ошибок м см. выше.

Просто возникла мысль - в ФБЕ "сварганить" скрипт типа "проверка целостности"  - т.е.
если МЕЖДУ строками(вернее абзауами) диалога попадается БЕЗДИАЛОГОВАЯ, которая начинается с ОДНОЙ буквы А или О или И или слова ПРИ и т.д. - то бить тревогу!
Другое дело ТОЛЬКО ради этого возможно затеваться и не стоит, а вот если туда "напихать" ещё каких-нить проверок - то пуркуабы и не па?

Что скажите?

255

Alex2L написал(а):

Просто возникла мысль - в ФБЕ "сварганить" скрипт типа "проверка целостности"  - т.е.
если МЕЖДУ строками(вернее абзауами) диалога попадается БЕЗДИАЛОГОВАЯ, которая начинается с ОДНОЙ буквы А или О или И или слова ПРИ и т.д. - то бить тревогу!
Другое дело ТОЛЬКО ради этого возможно затеваться и не стоит, а вот если туда "напихать" ещё каких-нить проверок - то пуркуабы и не па?


А нельзя эту проверку "пристроить" в какой-то имеющийся скрипт?
С другой стороны - пропуск диалоговых тире встречается и в другом варианте: когда тире пропущены в целом фрагменте, а не только в одной строке.

Да и, если совсем откровенно, я уверена, что не выловить всё скриптами - читать нужно глазками. Мечта об "однокнопочном конвертере" - не моя. ;)

Только что скормила скрипту следующий файл - шикарно сработал.  :cool:
Ещё раз - огромное спасибо.  http://fludu.h1.ru/Smiles/girl_in_love.gif

256

Только что скормила скрипту следующий файл - шикарно сработал.   
Ещё раз - огромное спасибо.


- ЗдОрово! Всегда пожалуйста! :)

Понемногу обещанное (с утра) претворяю в жизнь:
http://rusfolder.com/32482905

' Версия: 2.20 [05.09.2012] - Улучшено детектирование стихов
'            Устраняемые скриптом FB-Editir-а разрывы абзацев выделены в группу
'            "Внутриабзацный разрыв" и помещены под спойлер

А нельзя эту проверку "пристроить" в какой-то имеющийся скрипт?

при желании возможно многое.
Подумаю...

Перефразируя "Маугли" Р. Киплинга с его "Удачной охоты!" (с) - Удачной работы! :)

257

Спасибо за новую версию.

А я зашла, чтобы выразить восторг по поводу очередной "скормленной" скрипту книги.  http://fludu.h1.ru/Smiles/yahoo.gif
Большое количество искомых мест - глазами точно что-нибудь бы да пропустила.  :dontknow:
При том, что книга не слишком "чисто" распозналась (волнистая бумага, видно, когда-то намочили), ложных срабатываний немного.

Из замеченного: скрипт не увидел * * *, которыми отбиты подглавы, и один раз не увидел заголовок. Некритично. :)

258

Моё почтение!
Спасибо, но, пожалуй, довольно восторгов. :)
Рад, что и ошибки ловятся и глазки берегутся и врямя экономится.
Больше качественно сделанных книг с помощью скрипта - что может быть лучше.

скрипт не увидел * * *, которыми отбиты подглавы, и один раз не увидел заголовок.

- взял на "заметку".

259

Alex2L написал(а):

Спасибо, но, пожалуй, довольно восторгов.

Не могу. Бо я-то могу сравнить: как это - без скрипта и с ним. ;)
Другие, которые не вылавливали эти ошибки, не могут это оценить.  :playful:

260

Ок!

GMAP писал(а):
У меня этот скрипт стабильно валится с такой ошибкой: Сценарий: c:\_FBEditor\Script\spotter.vbs Строка: 236 Символ: 5 Ошибка: Индекс выходит за пределы допустимого диапазона: 'nStrLen' Код: 800A0009 Источник: Ошибка выполнения Microsoft VBScript

- в принципе это может быть, если строка книги больше 200 символов! o.O

Я-то считал и 100 - много, но на всяк случай удвоил. И на тебе!
В очередной версии сделаю для этого места "защиту от дурака". Но что же такое можно сканировать?! Не могу понять!

261

Alex2L написал(а):

в принципе это может быть,

Меня насторожило место хранения скрипта.  :unsure:
Боюсь, он его не там и не для того запускает.

262

Alex2L написал(а):

Устраняемые скриптом FB-Editir-а разрывы абзацев выделены в группу
"Внутриабзацный разрыв" и помещены под спойлер

Подумала.  :idea:

Наверное, не надо спойлер. Бо, если я решу исправлять эти ошибки на этой стадии, мне придётся кликать каждый раз, чтобы его открыть.
Другим цветом выделить - это хорошо. Я могу сразу решить, буду ли читать отметки этого цвета.

Что скажете?

P.S. Не пора ли нам перейти на "ты"? При таком-то тесном общении? http://fludu.h1.ru/Smiles/friends.gif

263

Кстати, народ зашевелился. ;)

264

Не пора ли нам перейти на "ты"? При таком-то тесном общении?

Ok!  Но тогда, если можно (как говориться - больше никому!)  - как звать-величать?!
А то только "ты" да "ты"  :sceptic:
Меня же - Алекс (вполне устраивает!) - это сокр. от Александра.

Меня насторожило место хранения скрипта.   
Боюсь, он его не там и не для того запускает.

э... ну в форуме golma1 писала - дескать неважно, где пристроен скрипт. Это истинно так! - пробавал, ради интереса, пристраивать в директорию FBEditor-а - так ни фига! Из ФБЕ скрипт не виден, так что с этим порядок. Скорее всего, как говориться, "если ничего не получается, прочтите, наконец, инструкцию!". Так вот - похоже, что gmap сохранила без разделение на строки.

не надо спойлер

- :) Без проблем! Вечером подгоню новую версию.

265

Alex2L написал(а):

как звать-величать?!

Голма.  http://fludu.h1.ru/Smiles/gif_4praga3t.gif
Меня друзья и в реале так называют.  http://fludu.h1.ru/Smiles/mosking.gif

Alex2L написал(а):

Вечером подгоню новую версию.

Можешь не спешить. У меня внезапно кончились книги на распознавание.  :dontknow:
Буду разгребать другие завалы. ;)

266

Очень приятно!
Ок!

Хм. Прочел это после того, как залил: http://rusfolder.com/32499403

Там особо ничего не поменялось, кроме как добавлена "защита от дурака", но на нормальной ширине (т.е. не более 80-ти) - это не скажется, а на непонятно-широких книжных страницах результат все равно труднопрогнозируемый.
Скрипт "ловит" по наиболее частораспространенной. Что-то, конечно, и в этом случае выдаст.

Кстати, ПОКА не "ловятся" сноски - нужно быть внимательнее как раз на страницах со сносками. Не ровен час, так совпадёт, что будет разрыв абзаца страницей, а из-за сносок это дело можно и прпустить. Не это - маловероятный неблагоприятный случай, но тем не менее... Пока надо быть по-внимательнее и подождать какое-то время.

Да, ещё в новой 2.21 версии т.к. "Внутриабзацный разрыв" (в виде спойлера) изначально развернут, пришлось (временно?) убрать из строк конструкции [+] и [-] для этого случая. (Это ни на что не влияет, только визуальный эффект)

Удачного/быстрого разгрёба завалов.  :)

P.S. 21:42 Москвы - уже "поборол" эти +/-.  Пока не выкладываю - всё равно - "косметика".

Отредактировано Alex2L (2012-09-06 21:43:50)

267

Пасипа, забрала.
Мне как раз подбросили очередной скан, буду пробовать. :)

Насчёт сносок - опять-таки не критично. На странице со сноской внимание усиливается.
Да и разрыв абзаца страницей визуально легче определяется, чем разрыв абзаца внутри страницы. ;)

268

Алекс, я там отписалась в форуме по поводу сегодняшнего прогона скрипта.

Сегодняшний "улов":

Тривиальный разрыв абзаца страницей - 159 (спрятан в спойлер, не обрабатывается)
Разрыв абзаца страницей - 14 (отметила служебными знаками, чтобы соединить в ФБЕ)
Подозрительный фрагмент текста - 1 (оказался разрывом абзаца, когда следующая строка начиналась с цифры)
Возможный разрыв абзаца - 15 (в 2-х случаях оказался разрывом, остальные - перед ***, проверила один раз)
Внутриабзацный разрыв - 18 (выделено зелёным, обрабатывается на усмотрение OCR-щика; я разрывы исправила)

Затрата времени (с момента запуска скрипта) - 9 минут.


Мне важной информацией кажется вариант с "подозрительным фрагментом текста". То есть, в критерии стоит включить не только прописную букву, но и цифры.
Или?

269

Alex2L написал(а):

в принципе это может быть, если строка книги больше 200 символов!

Ты прочитал в форуме? Он запустил скрипт на какой-то текстовый файл, к ФР никакого отношения не имеющий.

Это вообще тот ещё типчик.
Пользуется скриптами EmEditora, писал как-то об этом в форуме. При проверке пользуется ещё кучей программ. Когда я упомянула, что мне достаточно ФР и ФБЕ, предложил проверить мой файл. Обнаружил одну ошибку - вместо "ит" курсивом, было um. С тех пор я все такие места в курсиве проверяю, спасибо ему.

Потом у нас была долгая переписка в личке. Я обнаружила, что его файлы... ммм... ну скажем, невысокого качества. Он сказал, что это было раньше, а теперь он вник и делает файлы лучше.
Потом была долгая дискуссия по поводу скриптов ФБЕ. Я ему продемонстрировала, что один-единственный скрипт "Поиск по регэкспам" заменяет все его поиски в EmEditore и ищет ещё больше сомнительных мест.
Потом он мне морочил голову, что у него не придаются "горячие клавиши". Потом у него не запускался скрипт "Запустить последний скрипт". Потом...

В общем, в какой-то момент он отстал, и я решила, что он убедился в преимуществе ФБЕ над кучей других программ, которыми он пользовался.
Нуивот.

Вообще-то он, вроде, в теме. Сам делает портабельные версии программ, что-то ещё мне рассказывал о программировании. Но, поскольку я сама от этого весьма далека, оценить его уровень знаний не могу.

Наверное, будет нудить.  http://fludu.h1.ru/Smiles/dirol.gif

270

Моё почтение, Голма!

Ага, форум читал... И даже писал. :)
Спасибо!

Тут эта... Заметил, когда допиливаю книгу:

Так думал Дрого, стоя у конца плато и глядя, как часовые ходят
взад-вперед по краю стены. Флаг на крыше бессильно свесился, трубы не
Дымились, ни единой живой души не было видно на плацу.

     Какая скучная жизнь у него впереди! Веселый Морель, скорее всего,
Уедет одним из первых, и у Дрого не останется практически ни одного
Приятеля. Все та же караульная служба, та же игра в карты да изредка
вылазки в ближайшую деревню, где можно выпить чего-нибудь и найти

109
непритязательную подружку на часок. Какое убожество, думал Дрого.
И все же было неизъяснимое очарование в этих контурах желтых реду-
тов, какая-то тайна гнездилась во тьме оборонительных рвов, в сумрач-
ных казематах. И все это создавало не передаваемое словами предощуще-
ние грядущих событий.


Заметила? Может это так только у меня?!  o.O
Но сталкивался многократно. Как правило, ЭТО случается в нижней трети страницы,
возможно из-за загиба бумаги, но ПЧ некоторые слова (обычно на Д, У и в данном случае на П) воспроизводит с Прописной. Если и это нужно детектировать - то стоит поразмышлять, но вырисовывается такой алгоритм: Слово в начале строки с Прописной, а предшествующая строка заканчивается строчной либо запятой. Ну и предупредить об этом!
Букву при этом в протоколе "красить" красным. В принципе это моим-же "Точка-запятая" в ФБЭ "ловиться". Но там тоже "нагрузка" на глаза.
Я его, кстати, тоже немного передалать хочу. Когда время появиться.

Я внятен?!

P.S.

Мне важной информацией кажется вариант с "подозрительным фрагментом текста". То есть, в критерии стоит включить не только прописную букву, но и цифры.

- фрагмент, а лучше текст - "в студию!" (с)

P.P.S. Тот фрагмент, что я воспроизвел в начале письма здеся выглядит "некузяво", но полагаю, понятно, что имел в виду?

Отредактировано Alex2L (2012-09-07 15:33:49)


Вы здесь » Графика » Остальные программы » Скрипты и регеспы