Графика

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Графика » Остальные программы » Скрипты и регеспы


Скрипты и регеспы

Сообщений 91 страница 120 из 1007

91

Не, пока с ПЧ (ФР) не получиться. :(
Там есть возможность, создавая новый язык создать словарь на основе регекспов, но, похоже возможности скудные, да и как прикрутить неясно. Вот когда они дадут возможность плагинами или как-нить  по другому "прикручивать"
проверку регекспами - тогда - другое дело!
А так да - для ФБЕ. При условии что есть дежавюха (пэ-дэ-эф-ка) с текстовым слоем - енто не проблема, тем более,
если, как говориться, "поезд ушел" - т.е. ПЧ/(ФР)-ного документа вже нема! :)
Кстати есть кое-какие мысли по поводу совместной работы ФБЕ и файла с текстовым слоем. Размышляю...

92

И еще. Если этот скрипт 100% ловит этот разрыв абзаца, то не факт, что лучше просмотреть, скажем 500 страниц текста? а не прогнать скриптом и в 90% случаем отмести найденное, как ложное срабатывание, не прибегая к оригиналу? Опять-же, ИМХО. :)

93

Alex2L написал(а):

И еще. Если этот скрипт 100% ловит этот разрыв абзаца, то не факт, что лучше просмотреть, скажем 500 страниц текста? а не прогнать скриптом и в 90% случаем отмести найденное, как ложное срабатывание, не прибегая к оригиналу? Опять-же, ИМХО. :)

Ну может быть... Будем пробовать. Спасибо. :)

94

Отчёт. К сожалению, не слишком представительный, поскольку в книге нашёлся только один случай.

В ФР место выглядит так:
http://s1.uploads.ru/i/GbCDi.jpg

При экспорте в FBE и прохождении скриптом картинка выглядит так:

http://s1.uploads.ru/i/6x0vo.jpg

По-моему, это просто совпадение, нет?
Скрипт увидел предыдущую короткую строку, но не среагировал на нужную.

Или "Обратите внимание на предыдущий абзац" надо интерпретировать иначе?

Сам скрипт очень наглядный и интерфейс нравится.  :cool: Если бы он ещё искал нужные места. ;)

В любом случае, Алекс, огромное спасибо, что Вы обращаете внимание на нужды верстальщиков и Вам хочется нам помочь.  http://fludu.h1.ru/Smiles/give_heart2.gif

Забыла сказать: буду проверять дальше.  :writing:

Отредактировано golma1 (2012-08-07 14:53:12)

95

Здравствуйте!
И вам спасибо за тестирование! Скорее всего, скрипт нуждается в доработке по части формулировок. А отработал (спозиционировал) он правильно!. Уже писал - абзацы проверяються последовательно-попарно друг за другом.
Я внятен?!  :blush:
Принято (уже писал), что длина строки (в бумажной книге не долее)- 57 символов - т.е. если больше - абзац стало быть - не наш случай.
А вот, если - да, то проверяется плотнее. Может правильнее во всплывающем окошке писать типа: "Возможный разрыв абзаца в строке!" ? (Курсор так и будет позиционироваться, как сейчас).

96

Дополнительно.
Фактически скрипт ловит относительно короткие (размером не более бумажной строки) подряд идущие абзацы,
и обращает внимание, что в один из них начинается на дефис/тире. Т.о. подозрение падает на второй абзац (из пары), который и вызывает смутные сомнения, а не разрыв ли это абзаца. Как то так.

97

И еще. :)
Для сокращения кол-ва ложных срабатываний, наверное правильно будет анализировать не два подряд, а три абзаца, и если третий начинается с тире/дефиса, то это не наш случай. С другой стороны - возможно это ошибка распознавания диалога (пропущено тире). Надо поэксперементировать! Пока текущий вариант можно не использовать. Как исправлю - отпишусь.

98

Alex2L написал(а):

Дополнительно.
Фактически скрипт ловит относительно короткие (размером не более бумажной строки) подряд идущие абзацы,
и обращает внимание, что в один из них начинается на дефис/тире. Т.о. подозрение падает на второй абзац (из пары), который и вызывает смутные сомнения, а не разрыв ли это абзаца. Как то так.

Да, я это поняла.
В приведённом примере он посчитал, что строка с курсором оторвана от предыдущей строки (посчитал знаки в реплике "Чтоб меня черти взяли..."). А на самом деле оторвана была следующая строка от неё.
При этом можно видеть, что наличие тире вовсе не обязательно.

Я внятна? (с) ;) Очень мне нравится Ваша формулировка.

Alex2L написал(а):

Может правильнее во всплывающем окошке писать типа: "Возможный разрыв абзаца в строке!" ? (Курсор так и будет позиционироваться, как сейчас).

При указанном положении курсора это более ясная формулировка. Но только в случае, если будут изменены критерии поиска. Потому что, думаю, приведённый случай - это просто совпадение: на самом деле скрипт нашёл сомнительное место по своим критериям. То, что эта же строка оказалась разорванной, - случайность.

Я всё-таки попробую ещё на парочке книг. Может, выявится какая-нибудь закономерность.

99

Alex2L написал(а):

Для сокращения кол-ва ложных срабатываний, наверное правильно будет анализировать не два подряд, а три абзаца, и если третий начинается с тире/дефиса, то это не наш случай.

Срабатываний, кстати, было не так уж много.
Но книга вообще очень хорошо распозналась, так что Вы правы - надо экспериментировать. :)

100

Добрый вечер!
Новая версия: http://rusfolder.com/32033804
Изменений довольно много - добавился стартовый диалог, учитываются ТРИ абзаца подряд, уточнены формулировки.
В стартовом диалоге указывать ТОЧНОЕ кол-во символов на строку - необязательно. 55 и так с запасом. В книгах, как правило: от 48 до 53-х. Но вот, если, скажем длина строки (средняя по книге) - 40 символов (в т.ч. пробелы и знаки препинания) - то лучше указать - 45. Или, скажем, что-то больно убористо-широкое, в среднем - 67 символов.
Лучше указать - 70. А так - можно просто "хрясать" Enter.
Из-за анализ трёх абзацев подряд уменьшилось кол-во "ложных" срабатываний, ну тут всё зависит от автора, как он написал.
Курсор в новой версии позиционируется на третьем (из тройки) абзаце и выводит предупреждение с более пристойной формулировкой.
Поганял на некоторых своих выложенных книгах. Кое-где обнаружил - увы и ах! - разорванный абзац. По одному-два на файл. Халтура-лайт, стало быть. :(
C другой стороны - работой скрипта полностью удовлетворен. Впредь разорванный абзац - не пройдёт!

Я внятна? (с)  Очень мне нравится Ваша формулировка.

- ага...
Спасибо! На самом деле это цитата (неоднократно упоминаемая в книге Ю.Полякова "Грибной царь").
Самому нравиться.
И вдобавок - недруги величают Юрия Полякова как "Юркий Подляков" - не перевелись таланты! :)

Спасибо за внимание!
Удачи!

101

Собралась как раз написать следующий отчёт, но проверю сначала новый вариант. :)

102

Рассказываю.

При прогоне первым вариантом скрипта было обнаружено два места, схожих с описанным выше. Второй вариант их тоже нашёл. За счёт более точной формулировки вопросов не возникло.  :cool:

Первый вариант один раз сработал здесь:
http://s1.uploads.ru/i/3n7y0.jpg

Что, конечно, неправильно. Зато второй вариант сработал правильно.  :cool:

А теперь плохие новости, к работе скрипта отношения не имеющие. :(

В тексте обнаружилось ещё два разрыва, критерии которых, насколько я понимаю, никак не подпадают под скрипт.
Вот одно из них:

http://s1.uploads.ru/i/1cwFz.jpg

103

На первый вариант мона и нуна забить!
У... Мелковато видно... Но... Мда...
Непонятно за что "цепляться"! :(
Разве что, "По ..." начинается с нулевой позиции в окне ПЧ.
С ходу предложить не могу ничего!

104

А второй случай?

105

Alex2L написал(а):

Разве что, "По ..." начинается с нулевой позиции в окне ПЧ.

Кстати, да, я как раз хотела сказать. Я задумалась, как я определяю "спорное место", ведь смотрю я только на окно "Текст". И поняла, что бессознательно искала именно такие абзацы - без отступа.
Я сейчас наловчилась, листаю довольно быстро. Иногда приходится возвращаться на предыдущую страницу, потому что глаз за что-то "зацепился". Специально проверила - речь идёт именно о таких абзацах.

Но для скрипта это ни разу не помощь. Поскольку в ФБЕ такой абзац выглядит обычно, ничем от других не отличаясь. :(

106

Alex2L написал(а):

А второй случай?

Не сделала сразу скриншот, теперь не могу найти. Сорри.  :blush:
Но тоже - НЕ после реплики в диалоге и НЕ в первой строке абзаца.

107

Вы довольно немилосердны к своим глазкам!
Ок! Поразмышляю на досуге! Но ничего не обещаю...

108

Alex2L написал(а):

Вы довольно немилосердны к своим глазкам!

Проклятый перфекционизм!  http://fludu.h1.ru/Smiles/blush2.gif

109

Сегодня скрипт не нашёл два места с "типичным" разрывом строки. :(

http://s1.uploads.ru/i/Bo6nV.jpg

http://s1.uploads.ru/i/hmDkn.jpg

110

Добрый день!
Ага... Ненаходчивость объясняется тем, что посчитал: первая (диалоговая) строка не слишком по длине должна отличаться от второй (ошибочно разорванной). Считал, что эта дельта длин не больше 5. Просчитался... :(
Если есть интерес продолжить эксперимент, то либо могу выложить исправленную версию, либо в 36-й строке скрипта (считая от верха), конкретно такую:

var Delta  = 5;

нужно изменить на:

var Delta  = 20;

- пожалуй должно хватать и ложных срабатываний много не лезть. Полагаю справитесь!

Была мысль вынести этот параметр в диалоговое окно, (20 - скажем по-умолчанию), но не подобрал
внятной формулировки, как его обозвать.  :(
Может есть идеи?!

И наконец, я внятен?! :)
И, конечно, спасибо!

111

Я исправила и скрипт сработал правильно.  :cool:

Как назвать "дельту", может, и можно придумать, но, боюсь, будет выглядеть пугающе для нубов. Чем меньше настроек, тем проще новичкам. Их и так само слово "скрипты" пугает. ;)
Лучше цифру подобрать эмпирически. :)
Потестируем ещё на нескольких книгах.

В любом случае, это, конечно, подмога. Бывают ситуации, когда нет просто сил просматривать ещё раз книгу, особенно, если она большая по объёму. А скрипт выловит хотя бы "типичные" разрывы. Да и "нетипичные" встречаются не так чтобы часто.  В определённых ситуациях можно пренебречь. ;)

Спасибо.  :flirt:

P.S. Кстати, в этой книге (после исправления скрипта) было всего 1 ложное срабатывание.

Отредактировано golma1 (2012-08-09 23:49:26)

112

Уря!
Та отож! Нубы!
Правильно, наверное, будет увязать эту "дельту" с параметром "длина строки" - где-то на уровне 0.35-0.45.
И не афишировать этот параметр! :)
Сильно завышать - полезут "ложные" - может и немного, но полезут. Т.е. от "ложных" никуда не деться, но лучше - перебдеть!

А вот с тем другим случаем "разорванности" пока плохо. :(

Удачи! :)

113

Моё почтение!
Значит, так! Зародилась новая идея... Размышляю! Существенным
подспорьем будут отдельные jpg-файлы тех страниц, где скрипт "промахивается", либо вообще "мышей не ловит" - a-la кусман скрипта о событиях в аббатстве (/монастыре?) на моё мыло. Ну или хотя бы скриншоты покрупнее.

114

Упс!

В последнем сообщении, вместо:

a-la кусман скрипта

следует читать: a-la кусман скрина

:)

115

Alex2L написал(а):

подспорьем будут отдельные jpg-файлы тех страниц, где скрипт "промахивается", либо вообще "мышей не ловит" - a-la кусман скрипта о событиях в аббатстве (/монастыре?) на моё мыло.

Будет сделано. :)

Но сейчас возникнет небольшая пауза в работе. Сын приезжает в гости. Так что на несколько дней я выпадаю.  :flirt:

116

Моё почтение!
Ок! :)
Хотя по размышлении, пришел к выводу, что пожалуй примеры страниц не нужны.
Проанализировав имеющиеся скриншоты и собственные jpg-и, djvu-и пришел к  :idea:
Короче - идея такая: абзац рвёться в тех местах, где посередине его на бумажном носителе некая строка кончается точкой. Если абзац разрывает страница - ес-но наш случай! Первая строка, заканчивающаяся точкой - тоже подпадает под этот случай. (Если перед ней однострочный диалог - катализатор разрыва.). Притом, разрыв происходит не всега, но если происходит - то только в этом случае: строка (книжная) заканчивается точкой, близкорасположенной к правому краю страницы. Вот этот-то случай я и собираюсь "ловить".  Обоснованно предполагаю, что удасться, но не без: 1. лишних телодвижений и 2. некоторого кол-ва ложных срабатываний.
Но, похоже, дело того стоит! :)
Да ещё - всё зто планирую "ловить" ДО создания FB2-файла из ПЧ.

Я внятен?!

117

Alex2L написал(а):

Притом, разрыв происходит не всегда, но если происходит - то только в этом случае: строка (книжная) заканчивается точкой, близкорасположенной к правому краю страницы.

Совершенно верно, отлично сформулировано.

Alex2L написал(а):

Да ещё - всё зто планирую "ловить" ДО создания FB2-файла из ПЧ.

Вау! Это - лучшая из новостей.  :cool:
Поскольку предполагает возможность сразу увидеть, "наш" ли это случай. Если получится, Вы - гигант. И если не получится, тоже.  http://fludu.h1.ru/Smiles/JC_gimmefive.gif

P.S. Пока сын отсыпается, делаю потихоньку книги. В последней скрипт выловил все (2) "типичные" разрывы. "Нетипичных" не наблюдалось.  Количество ложных срабатываний - 2.
По-моему, отличный результат.  http://fludu.h1.ru/Smiles/i-m_so_happy.gif

118

Здравствуйте!
Получиться-получиться!
Спокойствие, только спокойствие! (с)
Отличные новости! 2+2 - это, действительно, здорово! Такого и не ожидал. Но, предполагал!
Работа с новым скриптом тоже движется. И успешно. Думаю так - если мой новый способ "отлова разрыва" будет признан годным, то этот нынешний скрипт сгодится для работы, как сейчас; и  если не пользоваться новым. Просто смысла не будет. Посмотрим. Кстати, подумал, что по-новому мона будет достаточно легко "ловить" стихи в тексте,
ну и "протоколировать" этот факт. Ок, это будет - "доработка-2" :)
Пусть сначала заработает "базовая версия".

Удачной охоты! (с) т.е. - работы.

119

Alex2L написал(а):

что по-новому мона будет достаточно легко "ловить" стихи в тексте,

Тоже хорошая тема.  :flirt:

120

Я что-то запуталась, что надо присылать.  :blush:
На всякий случай вот ссылка на "нетипичный разрыв":  скан и скриншот.
Если не надо, то и ладно. ;)

Вотти, обрати внимание на хостинг - для него есть аддон для ФФ. Очень удобно.

И сразу ещё один: скан и скриншот.

В обоих случаях - в начале строки Т, которое неправильно распозналось.

Отредактировано golma1 (2012-08-13 21:09:51)

Быстрый ответ

Напишите ваше сообщение и нажмите «Отправить»



Вы здесь » Графика » Остальные программы » Скрипты и регеспы