Графика

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Графика » Остальные программы » Скрипты и регеспы


Скрипты и регеспы

Сообщений 451 страница 480 из 1000

451

Значится, так!
Пожалуй, пока - пауза.

такие книги встречаются крайне редко

- ок! Других не надо.

Просто случаи этой и предыдущей книг - в основной массе однотипные. Большинство будут отлавливаться.
Над некоторыми - надо думать.

Итак, только редкие случАи! Бережем силы для тестирования spotter-3   http://fludu.h1.ru/Smiles/smile3.gif

452

Alex2L написал(а):

Итак, только редкие случАи! Бережем силы для тестирования spotter-3

Abgemacht!  http://fludu.h1.ru/Smiles/JC_gimmefive.gif

453

Не исключено, что и аbgemacht!
Но тем не менее: http://rusfolder.com/32895535
Версия 2.29 - Исправлены замеченные ошибки детектирования слипшихся/разорванных абзацев

— Несколько часов, — предложил Алан. — Не дней. [абзац] После его ухода Мэри Лу долго стояла у окна и [разрыв абзаца]

смотрела на центр Сан-Диего — города, который не обрадуется, когда с Кори Блезингейма снимут обвинения.

- ошибки такого рода не понравились(в двух книгах подряд), да и они легко устранимы.
Подобное классифицируется скриптом aka "Подозрительный фрагмент текста !!!"  (так мне удобнее, что бы не заморачиваться).

454

Ух ты неуёмный. :)

Забрала. Запущу на следующей книге.

455

Никаких особенно новых ситуаций в следующей книге не обнаружено.  :flirt:

Я беру отпуск на две недели.
Вернусь 13-14-го. Не скучай!  :flag:

456

Моё почтение! http://fludu.h1.ru/Smiles/sm405.gif
Приятного отдыха!  http://fludu.h1.ru/Smiles/smile3.gif

457

Я вернулась! Полная впечатлений и сил.  :flag:

458

Моё почтение! Доброго здоровьечка!
Уря!
Как отдыхалось?!

Значится так! С сожалением приходиться констатировать, что spotter-3 "забуксовал."  :(
Что-ж-такович?! Такой вот "такович": я-то когда работал (и продолжаю работать!) со spotter-3, как действовал? - Пробую какой-нить регексп - о! Получилось! Пробую БД (базу данных) в джава-скрипте - о! Получилось! и т.д. И считал, что всё "на мази". Увы!

Как там в законах Мэрфи - "всё тянеться дольше, чем планировалось" и "всё сложнее, чем кажется".  Вот-вот! Наш случай. Короче - по-одному и тхт и htm-файлы парсируються успешно, а вот совместно - гораздо хуже. Намного хуже! :(
Если книга ну эдак полтора-два десятка страниц - то работать (вполне комфортно) мона.
А вот, если толще - ёк! То-ли утечки памяти, то-ли кака друга фигня, но время
ожидания окончания работы скрипта переходит все разумные границы.

Размышляю, как быть...
Spotter-3 будет точно! Но вот когда? Прийдётся, похоже, осваивать то, что никогда не делал - а для этого лопатить инет, разбираться с документацией, пробовать, воплощать... Но, повторяю - будет точно. Спокойствие! 

Утешительный бонус! :) Здеся: http://rusfolder.com/33130547
Переделал 24_Параграф-интерактив.js (с которого начинался spotter), и который,
теперь в FBE-скриптах без надобности на другой, который ловит (во всяком случае пытается) возможный случАй потери (в рез-те OCR) тире в прямой речи. Подвигнули на это, во-первых, совесть, что волокититься spotter-3, во-вторых досада при чтении, в частности Джон Бойнтон Пристли "Другое Место. Рассказы", за известным авторством :) (увы по-прежнему читаю, не хватает свободного времени!). Да так вот, в нескольких местах явно пропущены тире в прямой речи. Негодиться! (Целых 4 (четыре) случАя нашел! Либо я чего-то не понимаю!)

Ну не без "ложных" срабатываний. Но ради идеалов перфекционизма можно на эти жертвы пойтить; тем более что ложных срабатываний-то достаточно мало.
Короче, тестируем, делимся впечатлениями.

Я внятен?!

459

Alex2L написал(а):

Я внятен?!

Ээээ... я на всякий случай повторю, а ты проверишь, правильно ли я поняла. ;)

Изначальный скрипт "Параграф-интерактив" можно удалить, а вместо него поставить новую версию, которая умеет больше, чем изначальная. Его фишка в том, что он ловит пропущенные тире в диалогах.
Правильно?

Или он ещё чего-то делает?  :flirt:

Насчёт 3.х не переживай. Во-первых, будет ещё. А во-вторых, изначальная цель достигнута и передостигнута.  http://fludu.h1.ru/Smiles/JC_you_rock.gif

460

Изначальный скрипт "Параграф-интерактив" можно удалить

- в принципе можно переименовать как-нить. Хоть старый, хоть новый. Э... просто старый (изначальный скрипт "Параграф-интерактив") в свете spotter-2.XX теряет смысл. Ну разве что захочется старые выпуски книг пошерстить...

которая умеет больше, чем изначальная

- ну от изначальной там немного осталось. Т.е. ядро - то же, а предмет поиска - другой.

Его фишка в том, что он ловит пропущенные тире в диалогах

- и только в этом. Пока что. Не знаю, что можно еще "прикрутить". Но, во-всяком  случае, в нескольких выборочно проверенных книгах (за моим fb2-авторством) были найдены пропущенные тире.
Работа нового скрипта понравилась. Если довести до ума - то можно существенно избавится от ложных срабатываний. Хотя их и сейчас очень немного. Зависит от книги.  Можно отмечать книги, в которых будут ложные, а я их потом, после появления в библиотеке гляну, ну или на рапидшару до того.
Заценить работу можно, как раз на Пристли.

А теперя внятен?!

461

И что-то типа инструкции к новой версии: кнопка "Игнорировать" - т.е. скрипт "споткнулся" о ложное срабатывание - в сущности переход на следующий абзац. Кнопка "Продолжить" - случай действительно пропущенного тире. Исправляем (как сумеем) - и снова этот же абзац "прочекаем" - на предмет "а привильно-ли исправили?". Заметил (сейчас), что есть ложные сработки в разделе "Примечания" (если таковой присутствует).
Ясное дело - давим кнопку "Завершить".
Ну и на последок - ест-но скрипт начинает работать с абзаца курсора.

462

Здеся подправленная версия:
24_Параграф-интерактив v.1.02

Да, ещё: обязательно обновить html-ресурс из предыдущей посылки. В ней добавился один пункт.

Отредактировано Alex2L (2012-10-16 11:40:43)

463

Угу. Всё поняла. Сейчас как раз получила книгу в работу. Опробую. :)

464

Приветствую!

Опробовать можно в любой момент работы с FBE. Лучше после устранения разрывов абзаца.
Можно прогнать (из интереса) несколько недавних книг. Ну не факт, что там что-то обнаружится. Но и не исключено. :)

465

Промежуточный рапорт о spotter'e: из четырёх найденных слипшихся абзацев 3 были правильные.
Ну и всё остальное (разорванные абзацы) - как обычно, на высоте. :)

Позже сообщу, не было ли пропущенных слипшихся абзацев.

Что касается ФБЕ-шного скрипта, то на новых книгах проверю, а вот к старым возвращаться вряд ли стану.  :dontknow:

466

Моё почтение!
Подправленный FBE-шный скрипт:
Подправленный скриптик
- на том же Пристли откопал ещё один случАй потери тире - итого стало быть всего пять. Правда, за счет нескольких ложных срабатываний, но, похоже, оно того стоит.

не было ли пропущенных слипшихся абзацев

- ну тут от spotter-2 чудес ждать не приходится.
Вижу, как провидец - spotter-3 лихо управится! :)
Вот только, как скоро - не вижу. :(

467

Да, нашла ещё три случая слипшихся абзацев. Не привожу примеры - они уже были.

И новая версия, и предыдущая в моём файле обнаружила одно спорное место, но тире там не должно было быть.

Пропуск тире в диалогах сильно зависит от полиграфии - выбранной гарнитуры, качества печати. Бывают книги, где это очень актуально. В моей текущей - нет. ;)

468

Мой почтение!

Пропуск тире в диалогах сильно зависит от полиграфии - выбранной гарнитуры, качества печати. Бывают книги, где это очень актуально. В моей текущей - нет.


- та да. Как раз для актуальных случаев. Коли нет - то и слава богу!
Еще немного его (скрипт) улучшу (знаю как), отвлекусь от третьего споттера - пусть работает подсознание - ищет как порешать проблемы! :)

469

И снова - здравствуйте!

Здеся:Окончательный вариант

Добавил автоматизации, существенно уменьшил кол-во ложных сработок (это я так думаю).
Пожалуй, на этом возню со скриптом можно завершить. Ну если, конечно, не обнаружаться баги.
Т.к. проверка происходит достаточно быстро, то, полагаю, до трёх-пяти "ложных" сработок на файл среднего размера - вполне допустимо.

470

Ага, понятно.

471

Алекс, а не подскажешь, почему вот такой регесп  Абзац, начинается и заканчивается "ёлочками" (подозрение на цитату) ^[«](.*?)[»]$ другой  раз вешает ФБЕ намертво?

472

Приветствую, wotti! :)

Абзац, начинается и заканчивается "ёлочками" (подозрение на цитату) ^[«](.*?)[»]$


1. Было бы неплохо выложить куда-нить текст на котором этот регексп виснет.
2. Как по мне: [«] - квадратные скобки - лишние, т.к. кв. скобки означают, что должен присутствовать какой-нить символ из тех что внутри них (я внятен?!) - т.е. если символ один - елочки - выбор не ахти какой.
3. .*? - не ясная конструкция - т.е. буквально - любой символ - точка; хотя бы ноль или более раз - звёздочка;
то-ли будет то-ли нет - вопрос. Типа масло маслянное.

А если попробовать просто так: ^«.*»$  - чем не устраивает?! Кстати, такую конструацию мой регексп-интерактив ловит без проблем (на моём тестовом примере)

Отредактировано Alex2L (2012-10-20 11:02:59)

473

Ага, попробую

474

Алекс, привет!

Никак не получается протестировать новый скрипт - нет пропущенных тире в текущих книгах.  :dontknow:
Но мы своего дождёмся. ;)

475

Моё почтение!  http://fludu.h1.ru/Smiles/sm405.gif

нет пропущенных тире в текущих книгах

- так это не может не радовать!
Значит книга - кандидат в знак качества.
Как всегда - захочешь что-нить найти - так фиг-вам.

Скрипт из той серии, что не факт сработки не обязателен.
Правда возникает вопрос - а что насчет кол-ва ложных срабатываний. Навскидку - пара-тройка, до десятка и т.п. Хотя, понятно, книга - книге рознь.

476

У меня на последней книге сработал раз 5.

477

Ага... Если речь идёт о Л.Шепарде "Новый американский молитвенник" - так там несколько больше чем "раз 5".
Немного поколдовал: стиши (stanza) на предмет потери тире не проверяються. Все случаи со стихами, похоже, ложные. Тем более, что стихам и так уделяется повышенное внимание.

Подправленную версию пока не выкладываю - появились ещё мысли - нуна попробовать.
На работе с прочими проектами это не сильно скажется. :)

478

Попалась книжка с огромным количеством склеенных абзацев. Часть из них браво распознал spotter, но осталось ещё очень много.

Могу выложить сразу ФР-документ, если нужно (670 Мб).

479

Моё почтение!

Попалась книжка с огромным количеством склеенных абзацев. Часть из них браво распознал spotter, но осталось ещё очень много.

Могу выложить сразу ФР-документ, если нужно (670 Мб).


- уря! :)    http://fludu.h1.ru/Smiles/secret.gif Объём рояли не играет.

Как и угрожал(?!)   http://fludu.h1.ru/Smiles/mosking.gif : обновленная версия - изыскал возможность уменьшить ложные срабатывания.
Тренировался на "кошках". Итого - Пристли "Другое Место" - пять сработок по делу + 1 ложное.
Шепард "Новый американский молитвенник" - 1 ложное.

480

Ок. Поставила закачиваться.
Пока  pdf   для общего представления.

Книга неординарная. Боюсь, что новый скрипт в ней растеряется. ;) Там, где тире просится, его нет.


Вы здесь » Графика » Остальные программы » Скрипты и регеспы