Я посмотрела.
Разрывы абзацев страницей нашёл. А склеенные - нет. Но они там совершенно нетипичные, их можно рассматривать как стихи - ФР вечно склеивает строчки.
В любом случае - намного лучше.
Графика |
Привет, Гость! Войдите или зарегистрируйтесь.
Вы здесь » Графика » Остальные программы » Скрипты и регеспы
Я посмотрела.
Разрывы абзацев страницей нашёл. А склеенные - нет. Но они там совершенно нетипичные, их можно рассматривать как стихи - ФР вечно склеивает строчки.
В любом случае - намного лучше.
Малёхо отлегло от переживаний. И стихи и сноски - поборю со временем. Главное - качественная книга для тренировки появилась!
Моё почтение!
Тута: Метаграмма-контекст
Тестовая версия. Ловит однословные метаграммы. Инструкции должна изложить evernet.
Я внятен?!
Я внятен?!
Ага. Особенно в части
Инструкции должна изложить evernet.
Жду.
Целый день возился, пока не заработало так, как задумывалось. На инструкции сил не осталось.
На самом деле там всё не так сложно, просто я её попросил сделать что-то типа инструкции для пользователя.
Вот заодно не только скрипт потестим, а и внятность инструкции проверим. Так скать - 2 в 1-ом.
Я не против. Тем более, что подкину тебе сейчас работку со Споттером-3.
Пишу по мере продвижения по протоколу. Как закончу, добавлю файлы.
В книге много утерянного текста - в нижней трети страницы. До стр. 210 не могла нарадоваться (тем более, что и разорванный на точке абзац был найден). Потом началась котовасия.
После стр. 210 идут стр. 405 и 429, потом опять 210.
Причем на стр. 405 указан текст, которого на самом деле там нет.
Потом начались неверные срабатывания в поиске утерянного текста. Хотя текст там тоже отделен, но стиль у него "основной текст", а не "сноска".
стр. 226 - разрыв абзаца, действительно. Но не показана предыдущая строка. В предыдущем случае была показана.
То же самое, стр. 259.
стр. 284 - разрыв абзаца, действительно. Всё правильно указано.
То же самое, стр. 514.
стр. 406 - разрыв абзаца сноской, ложно. Хотя раньше один такой случай был обработан правильно.
То же самое, стр. 445.
стр. 434 - разрыв абзаца сноской, ложно. Указан фрагмент текста вверху страницы (6/36). В ФР стиль - "основной текст".
Отредактировано golma1 (2013-02-04 00:12:25)
Моё почтение!
Беглый осмотр показал, что сбой приключился из-за того, что фрагмент
стр. 212
Энди Кростуэйт переложил коричневый продоволь-
ственный пакет в левую руку, удовлетворенно вздохнул
и набрал на цифровой панели помещения поста охра-
ны «0-0-0-0». Внутри его поджидал знакомый стеллаж
с оружием.
- ПЧ не распознал как текст,
а
стр. 451
Ветер свистел в укутанных снегом соснах. Гэри мед-
ленно снял рукавицы, не сводя глаз с медведя-или-как-
его-там у сторожки. Если он не заберет Сару и Тима
сейчас, они останутся в ловушке на много дней. Он
понятия не имел, что за животное перед ним, но это,
в конце концов, всего лишь животное. А он — человек
с оружием.
- попал. А т.к. прога сличает строки, пытаясь найтить некое соответствие, то с одной стороны - несчастный случай:
абзац и там и тут заканчивается на:
с оружием.
и всё пошло наперекосяк.
С другой стороны - значит нужно что-то делать с алгоритмом соответствия строк. Частично это тоже что и было с предыдущей книгой (без верхних колонтитулов). Надо крепко думать... Но ест-но решаемо!
Я внятен7!
Здравствуйте.
Инструкцию делали вместе. Словечки "непропатченной Windows" для меня нехарактерны.
В архиве находятся три файла (распаковываем в удобной папке): собственно скрипт <33_Метаграмма-контекст.js>, файл словаря и reg-файл <Отключение окна сценарий замедляет работу.reg>. Начнем с последнего. Подробности на сайте: h t t p s : / / g r o u p s . g o o g l e . c o m / f o r u m / ? f r o m g r o u p s = # ! t o p i c / f i c t i o n - b o o k - e d i t o r / t H A O 5 U 0 l U 4 Q (в сообщении от 12-01-11). Применять в случае непропатченной Windows, по желанию.
Переместим файл словаря metagramma.xml в любую папку. (Нужен доступ на чтение-запись). Отредактируем любым редактором, понимающим кодировку utf-8, скрипт, секцию:
// -- Константы и параметры -------------------------------------------------------------------------------------
// Путь к словарю метаграмм
var MetagrammaPath = 'D://XML//Metagramma//';
// Путь к HTA-файлу протокола
var OutHtaFilePath = 'D://XML//Metagramma//';
// Варианты подбора цвета на сайте: http://www.w3schools.com/tags/ref_colormixer.asp
var Background = "#FFCCFF"; /* Подвариант magenta фон */
var MetaColor = "red"; /* Символы красного цвета */
прописав правильные пути, соблюдая "орфографию". MetagrammaPath и OutHtaFilePath могут совпадать (не обязательно). Сам файл скрипта перемещаем в папку <Скрипты> редактора FBE. После запуска FBE работаем как обычно. Запускать скрипт разумнее всего на последней стадии работы с FB2-файлом. На запрос о опасности ActiveX смело нажимаем ОК — пристало ли пиратам бежать от опасности.
Скрипт выполняется долго — от нескольких секунд до десятков минут. Придется немного подождать. Можно в эти минуты вспомнить долгие часы вычитки, уставшие глазки, окинуть мысленным взором нескончаемую вереницу несделанных книг.
Скрипт работает с абзаца курсора. Поэтому для оценки полезности работы скрипта можно переместить его несколькими абзацами выше конца файла и запустить скрипт.
После окончания работы появится протокол работы скрипта Метаграмма-контекст (всплывающий HTA-файл). Все возможные совпадения выделены цветом, при наведении курсора можно увидеть варианты распознавания слов-метаграмм. Для того, чтобы перейти к нужному абзацу, достаточно нажать на кнопку в конце абзаца >>> и первые 30 символов будут скопированы в буфер обмена, далее переключившись в FBE по Ctrl+F, или вашему варианту горячих клавиш для поиска находим интересующий фрагмент. Выделение метаграмм цвет букв + фон регулируется параметрами Background и MetaColor в секции - Константы и параметры -. Файл словаря metagramma.xml можно редактировать по желанию, соблюдая структуру.
Отредактировано evernet (2013-02-04 13:55:49)
абзац и там и тут заканчивается на:
с оружием.
Фигасе чувак прыгает!
Ладно, ждём. Хорошие книги стали попадаться, да?
Инструкцию делали вместе.
Ага, местами заметно.
Всё, вроде, поняла. Но пока воздержусь от участия.
Подключусь чуть позднее, когда разгребу свои завалы. Сейчас просто не хватает на всё времени.
Инструкцию скопировала, так что повторять не придётся.
Хорошие книги стали попадаться, да?
- чертовски хорошие!
Но пока воздержусь от участия.
- эт правильно!
Здеся: http://rusfolder.com/34837866 - новая версия.
Evernet! Внимание! Это тебя качается! Профиксил ошибочку!
Пробуй! Удачи!
Я внятен?
КрасавЕц!
Нашёл кучу потерянного текста (оформленного как сноски), штук 6 разрывов абзаца на точке, один склеенный абзац.
После распознавания расскажу о склеенных подробнЕе.
Моё почтение!
Это радует!
Жду подробностей!
При всём том, что "кривая" версия. Дюже "прыгучая"
Перецепился через Метеграмму-контекст. Крепкий орешек попался. Постепенно продвигаюсь вперёд.
Evernet (ау!) оказывает существенную помощь в тестировании.
Полагаю, внятен?!
Доброго дня.
Здесь немного исправленный словарь и уточненная инструкция. http://ge.tt/6SdILjX/v/0
Evernet
Можно просто Ever
Можно просто Ever
А можно русскими буквами - Эвер?
Меня можно.
Да, можно. Не приходило в голову такое прочтение. Или лучше по имени? И ник на Л. такой есть.
Хотя Эвер понравилось.
Или лучше по имени?
- а по имени-то как?! По имени?
Не приходило в голову такое прочтение.
Звучит классно.
По имени — Ольга. Но Эвер больше понравилась. Пусть будет.
Отредактировано evernet (2013-02-07 16:24:07)
О! Ольга!
О! Эвер!
Слипшихся абзацев не обнаружено.
Моё почтение!
Слипшихся абзацев не обнаружено.
- отлично!
Осталось выяснить, как со склеенными:
...один склеенный абзац. После распознавания расскажу о склеенных подробнЕе.
- так шо - всего таки только один?!
- так шо - всего таки только один?!
Ну да. Слипшиеся = склеенные.
Эх, нам бы книжечку с кучей слипшихся абзацев...
Итак: http://rusfolder.com/34910128 - ловит ВСЕ случаи метаграмм.
1. Если в первых 30 символах встречается ' (кавычка), то кнопки >>> под абзацем нет! Копировать из hta-файла нужно вручную.
2. Неразрывные пробелы заменяются на обычные, поэтому по нажатию >>> фрагмент может быть найден НЕ ВСЕГДА.
Рекомендуется ПЕРЕД скриптом менять неразрывные пробелы на обычные.
- Полезно добавить в инструкцию.
Я внятен?!
Алекс, у меня для тебя опять кое-что нашлось.
Очень странно распознанные разрывы абзацев страницей - например, стр. 10.
Смотрю дальше, если что - допишу.
Там вначале пару ошибок (например, стр. 29), потом долго правильно, потом стр. 145.
Отредактировано golma1 (2013-02-08 19:03:16)
Ну... особого криминала не заметил. Книга специфицкая - абзацных отступов ваще нет. Поэтому, если одна страница закончивается на знак точку (препинания) справа, то остаётся только гадать - а был-ли разрыв. Притом (я бегло смотрел) но, похоже, даже из контекста явно ничего не следует. А то, что т.н. тривиальные показывались вместе с подозрением на разрыв, полагаю, объяснеется тем, что в этих местах на ДВА (если предположить), что они не разорванные абзаца приходится ТРИ страницы. Ну не грех ТАКОЕ место засветить во всей красе.
Или имеется в виду что-то другое?!
Я внятен?!
Да я не настаиваю. Но там опять попадались куски текста с другой страницы. Причём не со следующей, а через две, что ли.
Ладно, не заморачивайся, книга и правда очень нестандартная.
Вы здесь » Графика » Остальные программы » Скрипты и регеспы