Склеенных абзацев не было.
Скрипты и регеспы
Сообщений 691 страница 720 из 1007
Поделиться6922013-01-11 11:15:09
Моё почтение!
Смотрю на либрусеке народ насчет метаграмм резко активизировался.
Эта... там (не столь давно)
6.1 Алексей_Н пишет: Скрипт получится огроменным...
- эт точно!
Я вот думаю пока пойти таким путём:
1. Принимаем во внимание, что метаграммы будут пополняться. Стало быть - объём расти.
2. На вскидку - в любом взятом наугад тексте будет относительно малый процент совпадений по метаграммам.
3. Ворочать большие объёмы под java-скриптами в FBE - достаточно паршиво. К скриптам на basic-е плохо "прикручиваються" memory-table. Напрашивается вывод - предварительно прогнать fb2-файл через специальную написанную прогу, которая найдёть в тексте только присутствующие в общем списке метаграммы и "вывалит" их во внешний файл, который уже в свою очередь подтянет их из FBE-шного скрипта. Я внятен? А в том скрипте найденные метаграммы будут просто визуализироваться с возможностью замены, в случае необходимости.
Явный недостаток - двухсткпенчатость. С другой стороны и Spotter-2 и Spotter-3 - тоже многоступенчатое решение, но ведь работает.
Я внятен?!
Поделиться6932013-01-11 13:01:30
Явный недостаток - двухсткпенчатость.
Мне кажется, что это довольно серьезный недостаток. Скрипт настолько хорош, насколько удобно и быстро (!) им пользоваться.
Например, скрипт "точка, запятая" я использую крайне редко, только потому, что он работает очень медленно и результативность, как правило, минимальная (речь идёт о книгах с обычной типографикой).
Не знаю, Алекс, мне трудно что-то подсказывать, я совершенно не в теме. Могу только сказать с точки зрения "нормального" верстальщика: если мне надо будет потратить 15 минут на нахождение 3 ошибок, я этим заниматься не буду.
Максима "вычитку ничто не заменит" этим скриптом не отменяется - всё равно будут ошибки, которые можно выявить только при чтении. Так какой смысл тратить кучу времени на то, чтобы исключить 1-2 из их числа?
Ключевое слово - "целесообразность", т. е. затраченное время должно соответствовать качеству результата.
Как-то так...
Поделиться6942013-01-11 13:46:18
Дык и я о том же. В смысле о целесообразности - производительности. Если что-то скрупулёзно выискивать скриптами в FBE - дюже долго. Другое дело - быстро (менее 1 мин.) просканировать текст fb2 и вынести резюме - дескать в тексте столько-то случАев типа "метаграмма". И ключевая фраза: "так фо делать-то бум?!". Ну а юзер уже чешет репу и размышляет...
Как-то так. Не попробовав ожнажды - трудно о чём либо сказать определённо.
Поделиться6952013-01-11 15:18:44
Не попробовав ожнажды - трудно о чём либо сказать определённо.
Конечно, попробуем. Для чего иначе было затевать?
Поделиться6962013-01-11 15:53:30
Следующая книга.
Опять есть два варианта одного (на мой взгляд) случая: "Внутриабзацный разрыв" (в спойлере) и "Разрыв абзаца".
См., например, стр. 148 и 170.
Хотелось бы понять логику. И тогда уже решить, прятать ли эти случаи в спойлер.
Споттер-2 нашел дополнительно один разрыв абзаца (назови, как хочешь ): стр. 296.
В целом, мне нравится намного больше: хороший обзор, не перегружен ложными срабатываниями.
Поделиться6972013-01-11 16:57:42
Итак!
1. Вчера вечером дома немного (всё относительно) поработал - появилась новая версия.
2. Вечером дома отпал инет.
3. На работе удалось довести её до ума. До прочтения сообщения о работе проги над Бен Кей "Инстинкт"
4. В принципе файлы от Spotter-2 мне СОВСЕМ не нужны и мона не присылать. Spotter-2 - пройденный этап.
5. HTA-файл тоже без надобности. Я всё равно перепроганяю с ВКЛЮЧЕННЫМ логом (ранее писал про этот режим).
6. По ентому логу видать:
1393 1 j 14 0: 0: 0: 1 small 93 ... 0 Cl=1067 170->170 TP=1
5858 170 23 36 1393 1490 0- 0- 0 30 93 2 TP TP — Убирайтесь, мать вашу! Убирайтесь из моего самолета!
1394 1 c -1 0: 1: 0: 0 small 98 EST ENB 0 Cl= 967 170->170 [ENB] BB=1
5859 170 24 36 1394 1491 0- 0- 0 29 98 0 CS CS Он стоял перед кабиной пилота, сжимая пистолет обеими
1395 2 j -1 0: 1: 0: 1 small 94 ENB 0 Cl=1033 170->170 BT=1 ST=1 OP=1
5860 170 25 36 1395 1492 0- 0- 0 30 95 0 SD SD руками и нервно водя им перед собой. Похоже, Мэдисон пло-
5861 170 26 36 1395 1492 0- 0- 0 31 93 0 SP SP хо понимал, что делает, и понятия не имел, кто перед ним.
т.е. когда скрипт грит: "Разрыв абзаца", то имеет в виду "стрёмное" место - видно что предудущая строка с точкой на конце справа. А вдруг это разорванный абзац?!. Ну что-бы зазря не колотиться и не тащить ту верхнюю, скорее всего НОРМАЛЬНУЮ строку в отчет - просто таким образом привлекается внимание.
"Внутриабзацный разрыв" - то что "словит" FBE-шный скрипт.
7.
Споттер-2 нашел дополнительно один разрыв абзаца (назови, как хочешь ): стр. 296.
- честно не понял, что там ДОПОЛНИТЕЛЬНО нашел Spotter-2. В новой проге просто знак страницы на строку выше. Думаю поправимо. Ах, sorry! Это я уже НОВОЙ (см. выше) прогой пробовал. Эта новая ВСЁ словила!
8.
В целом, мне нравится намного больше
Эта... больше чем что?!
Как в "Собачьем сердце" - "кто на ком стоял?! Выражайте ваши мысли яснее!"
9. Новую версию выложу вечером. Если инет вернётся.
Поделиться6982013-01-11 17:40:51
Эта..
Посмотрел случай с 296-й страницей в логе - такое дело:
2912 1 j 14 0: 0: 0: 1 small 98 ENB 0 Cl=1000 296->296 BB=1 UI=ER
10377 296 36 38 2912 3046 0- 0- 0 28 98 2 CS CS Наконец он достиг основания второго уровня. Утвердив
2913 3 j -1 0: 0: 0: 1 small 95 ENB 0 Cl= 433 296->297 BT=1 UI=ER ST=1 PP=1 OP=1 SL=1 BIP=1
10378 296 37 38 2913 3047 0- 0- 0 31 97 0 SD SD одну ногу на развороченном полу, он заглянул в темный про-
10379 296 38 38 0 3048 0- 0- 0 1 100 0 00 NN 297
2913 3 j -1 0: 0: 0: 1 small 95 ENB 0 Cl= 433 296->297 BT=1 UI=ER ST=1 PP=1 OP=1 SL=1 BIP=1
10380 297 1 38 2913 3048 0- 0- 0 33 98 0 SS SS вал за остатками термитника. Блеск хрома тут же сказал ему
10381 297 2 38 2913 3048 0- 0- 0 13 92 0 SP SP все, что он хотел знать.
- вердикт - "Разрыв абзаца страницей" - под спойлером. Ну да, на самом деле он дважды разорванный, но ФАКТИЧЕСКИ ОДИН раз (из-за особенности ПЧ). Этот раз будет без проблем ловиться FBE-шным скриптом. А знаки перевода строки <> - оказались выше на одну строку (против фактического), потому как ПЧ так объеденил абзац, разорванный стриницей - т.е. абзацы за номерами 2912 и 2913. 2913 - и есть разорванный страницей, и символы перехода на страницу поместились перед ним (это ежели раскрыть спойлер). Т.к. случай ТРИВИАЛЬНЫЙ - то ничего спецом изобретать не буду - смысла нет.
Я внятен?
Поделиться6992013-01-11 20:31:29
Я внятен?
Честно? Нет.
Но объяснять не надо. Я вовсе не хочу вникать в логи и пр. Мне важен исключительно результат работы скрипта. Как его достичь - решаешь ты.
Отвечаю на то, что поняла.
1. Я (пока) споттером-2 проверяю. Больше присылать не буду.
2. Нравится "намного больше, чем было в самом начале".
Поделиться7002013-01-11 21:04:06
Обещанное, существенно (кажется) улучшенное: Версия 1.15
Я (пока) споттером-2 проверяю
- всём, что пойдёт на пользу.
Нравится "намного больше, чем было в самом начале".
- а...
Поделиться7012013-01-11 21:07:30
Эта... так а насчёт "Внутриабзацный разрыв" (в спойлере) и "Разрыв абзаца" разница тоже что-ли невнятно выражена?!
Поделиться7022013-01-12 00:31:26
Заметил ошибочку. Поправил:
Версия 1.16
Предыдущую удалил.
По-прежнему на режиме ухудшенного детектирования сносок.
Поделиться7032013-01-12 01:19:52
Эта... так а насчёт "Внутриабзацный разрыв" (в спойлере) и "Разрыв абзаца" разница тоже что-ли невнятно выражена?!
Ну, то есть, я поняла, что это для скрипта разные случаи, но для меня как верстальщика это, во-первых, неочевидно, а во-вторых, неудобно: два варианта одного и того же для меня случая. Я трачу время на то, чтобы вникнуть, о чём идёт речь.
Новую версию забрала. Спасибо. Пока у меня пауза. Как только появится новая книга, опробую.
Поделиться7042013-01-12 10:47:35
Моё почтение!
для скрипта разные случаи, но для меня как верстальщика это, во-первых, неочевидно, а во-вторых, неудобно: два варианта одного и того же для меня случая. Я трачу время на то, чтобы вникнуть, о чём идёт речь.
Эта... Вот, скажем, кино: некого известного всем Федота играет некий, малоизвестный, Вася, но хорошо загримированный - вылитый Федот. Но, Федот - да не тот!
Так и здеся: разрыв, но... Но! Мы же только начали! Ежли по итогам проверки n-того кол-ва книг выяснится, что т.н. "Разрыв абзаца" = "Внутриабзацному разрыву" - так под спойлер его! Можно поступить радикальнее - долой из протокола! Не проблема!
Насчет вникания тоже неясно - если что-то упрятано под спойлер, то по идее с этим справятся FBE-шные скрипты, и заглядывать (тратить время) под спойлер особой нужды нет. А то, что не под спойлером - достаточно легко находится в документе ПЧ. Ну, чтобы уж совсем легко - Версия 1.17
Если не понравится - верну "взад", как было!
Поделиться7052013-01-12 12:20:57
Ну, чтобы уж совсем легко - Версия 1.17
Хммм... Теперь мне нужно оба скрипта опробовать, чтобы решить, какой лучше? Хи-и-и-итренький.
Насчет вникания тоже неясно - если что-то упрятано под спойлер, то по идее с этим справятся FBE-шные скрипты, и заглядывать (тратить время) под спойлер особой нужды нет.
Хороший критерий, годный!
Но всё немного затянется, поскольку сейчас на руках новых сканов нет.
Там список в Метаграммах сделали, видел?
Отредактировано golma1 (2013-01-12 12:22:23)
Поделиться7062013-01-12 12:30:58
Хммм... Теперь мне нужно оба скрипта опробовать, чтобы решить, какой лучше?
- нет, не нужно. Алгоритм обнаружения не менялся. Изменения ТОЛЬКО в протоколе (добавлена нумерация строк на странице слева бледно-серым, чтобы быстрее позиционировать взгляд на странице ПЧ. Т.е. куда стоит смотреть - вверх, вниз, в середину страницы - проба экономии времени).
Но всё немного затянется, поскольку сейчас на руках новых сканов нет.
- никто никуда не торопится. А матерала для совершенствования проги (недостатков очень много) - вполне достаточно.
Там список в Метаграммах сделали, видел?
- видел. Размышляю...
Поделиться7072013-01-14 15:23:53
Отчет: нареканий нет.
Поделиться7082013-01-14 15:55:07
Моё почтение!
Отчет: нареканий нет.
Эта... (из т.н. законов Мэрфи) - "если вам кажется, что дела идут хорошо, значит вы чего-то не замечаете"
Может просто книга такая попалась?!
Поделиться7092013-01-16 14:12:15
Может просто книга такая попалась?!
Может быть. Увидим.
Книг (пока) в работе нет. Но как только, так сразу.
Поделиться7102013-01-16 14:55:53
Моё почтение!
Ждёмс! Прога должна быть универсальной. И ловить по максимуму - 100 + 1%
при минимуме ложных срабатываний.
Пока решил заняться метаграммами. Написал Evernet (в личку) - предложение о сотрудничестве, что мол работа хорошая проделана, но непоследовательная, нуждается в доработке, и типа нужна помошница, которая одной из первых и протестирует скрипт. Но что-то барышня притихла... Ни ответа, ни привета... Такой подход несколько э... удивляет, однако. А без помошницы - хучь плачь!
Может испужалась ответственности?!
Поделиться7112013-01-16 23:42:50
Но что-то барышня притихла...
Дай человеку немного времени... Может, не заходила еще на сайт.
Получила новые сканы. Завтра расскажу о результатах.
Поделиться7122013-01-16 23:58:18
Дык а что остаётся делать?! Конечно даду. Эт точно, всё может быть!
Ага... Конечно, интересно!
Я тут эта... между делом "сварганил" книгу http://lib.rus.ec/b/412693. Собст-но оформил выложенный на сайте изд-ва текст + приделал обложку.
Авторская редакция. Правда, нигде не видать, что тута как раз авторская редакция против издательской редактуры в
ранее сделанной мной-же http://lib.rus.ec/b/333330. Вроде читают.
Поделиться7132013-01-17 13:27:57
Вроде читают.
Конечно, читают. Я твёрдо знаю, что для каждой книги есть свой читатель.
Отчет.
Нареканий нет.
Поделиться7142013-01-17 13:50:36
Моё почтение!
Нареканий нет.
- с одной стороны это радует...
Поделиться7152013-01-17 14:01:04
с одной стороны это радует...
Подождём ещё... Это была книжка с отличной полиграфией, без особых сложностей. Хочется добраться до какой-нибудь, где куча разорванных абзацев и пр. и пр.
Будет, никуда не денется.
Поделиться7162013-01-17 14:15:55
Ok, бум ждать.
Т.е., так понимаю, со Spotter-2 расхождений нет?
А хоть есть что-то, что не увидел Spotter-2?!
Поделиться7172013-01-18 15:37:22
А хоть есть что-то, что не увидел Spotter-2?!
Я в эту сторону не проверяла. Это надо отдельно сохранить проект ФР, пройтись 2-м, а потом проверить 3-им.
Надо?
Поделиться7182013-01-18 16:04:07
Моё почтение! Доброго здоровьечка!
Я в эту сторону не проверяла. Это надо отдельно сохранить проект ФР, пройтись 2-м, а потом проверить 3-им.
Надо?
Да?! А... не, ну я полагал, что Spotter-2 исчё активно используется. Потому и спрашивал.
Та не, коли так, спецом не надо!
Поделиться7192013-01-19 01:14:17
что Spotter-2 исчё активно используется
Используется так.
Я прохожусь по проекту 3-им, вношу исправления. Затем прохожусь вторым. Если нашёл что-то пропущенное, звоню в рельсу. Если не нашел, то и хорошо.
Для обратной проверки нужно сделать то же самое, но в обратной последовательности. Значит, нужен еще один экземпляр проекта, в котором сначала будут вноситься правки из 2-го.
Если очень нужно, могу сделать.
Поделиться7202013-01-19 10:25:49
Моё почтение!
Если очень нужно, могу сделать.
- да не нужно!
Интересовался технологией - уяснил:
прохожусь по проекту 3-им, вношу исправления. Затем прохожусь вторым.
Голма-то у нас хитренькая!
Я, сперва, думал, что и для второго и для треьего Spottеr-а txt- и htm-файлы генерируються ОДНОВРЕМЕННО, а тут эвон как! Изощрённо...
Собс-но интересует: а не находит-ли второй того, что пропустил третий. Так понимаю, что всё в порядке. Ну и отлично!
Быстрый ответ
Вы здесь » Графика » Остальные программы » Скрипты и регеспы