В последней книге слипшихся абзацев не обнаружено.
Скрипты и регеспы
Сообщений 601 страница 630 из 1007
Поделиться6022012-12-16 14:23:15
Моё почтение!
Понимаешь, я-то делаю всё равно по своему алгоритму. Так вот, он вылавливает все эти сноски/не сноски/не совсем сноски. Мне трудно судить о необходимости этой фичи. Для меня она - плюшка. Есть - хорошо, нет - ничего страшного.
- свой алгоритм - это хорошо! И очень интересно, при условии, что не надо напряженно пялиться в экран.
Меня терзают смутные сомнения... (с)
Во-первых, одна из задач - сберечь глазоньки. Сбереженные глазоньки - больше хороших книг. Во-вторых, тут вон уже очередь по чуть-чуть за прогой выстраивается, и не факт, что все захотят пользоваться "Алгоритмом Голмы", если есть похожий по рез-ту, но более комфортный.
Насчёт тривиальных разрывов - разница только в том, что в случае "псевдо"-тривиального в рез-те имеем ДВА абзаца, которые потом (в FBE) "сшиваем" скриптом. Добавить опцию - прятать "под спойлер" - не вопрос.
Почему упорно цепляюсь за это? Есть идея (вполне реализуемая) - добавить в HTA-протокол чек-боксы и при необходимости их "обгалчивать", а в ПЧ никаких zzz и т.п. не ставить и по итогам проверки HTA-протокола сформировать файл-правки и напустить на него сформированный FB2-файл, в котором все "обгалченные" места автоматицки исправятся. Впрочем это, пока, в дальних планах.
В последней книге слипшихся абзацев не обнаружено.
- хм! В плане отладки-натаскивания Spotter-3 это скорее плохо, чем хорошо!
Я внятен?
Поделиться6032012-12-16 17:26:35
И очень интересно, при условии, что не надо напряженно пялиться в экран.
Единственный момент, когда мне это было надо, это тот самый случай с точкой в конце строки, где абзац рвётся. Всё остальное - полуавтоматическое и уж точно наверняка.
если есть похожий по рез-ту, но более комфортный.
"Похожий по результаты" - это не "равный по результату".
Но ты прав, возможно, кого-то устроит. Ты знаешь, я перфекционистка. Как и ты.
До тех пор, пока у меня нет уверенности, что скрипт ловит "11 из 10" случаев, я перепроверяю.
Споттеру-2 доверяла только ту самую точку в конце строки (и то, когда проверила на 10 книгах), всё остальное - проверяла своими алгоритмами всё равно.
Добавить опцию - прятать "под спойлер" - не вопрос.
Тогда так и сделаем.
Сбереженные глазоньки - больше хороших книг. (с)
добавить в HTA-протокол чек-боксы и при необходимости их "обгалчивать", а в ПЧ никаких zzz и т.п. не ставить и по итогам проверки HTA-протокола сформировать файл-правки и напустить на него сформированный FB2-файл
Звучит сложно. Я не очень понимаю (и, честно говоря, не очень приветствую) разработку инструментов взамен тех, которые хорошо и удобно работают.
Но, возможно, я ошибаюсь...
В плане отладки-натаскивания Spotter-3 это скорее плохо, чем хорошо!
Это я понимаю. Тем более, что и скриптом эти места не обнаружены, т. е. нельзя проверить, видит ли он их и насколько хорошо.
Текущая книга очень объёмная и сложная. Извини, не буду прогонять Споттер-3. Она нетипичная, так что вряд ли пригодится для отладки.
Но протоколы и pdf могу выложить, если тебе интересно.
Поделиться6042012-12-16 18:24:39
Я не очень понимаю (и, честно говоря, не очень приветствую) разработку инструментов взамен тех, которые хорошо и удобно работают.
- а как же прогресс?! И потом, новые версии ПЧ приветствуються. Не так ли?!
Но протоколы и pdf могу выложить, если тебе интересно.
Интересно. Протоколы? И шо - много протоколов?! Годится! Но обязательно необходимы txt и htm в utf-8 кодировке.
Поделиться6052012-12-16 18:40:11
И потом, новые версии ПЧ приветствуються.
Если несут с собой улучшения.
Но работать с ФР начал только ты. Основным предметом работы был изначально fb2-файл. И на него всё заточено.
Это моё неуёмное стремление к совершенству заставляет выискивать уже в ФР все косяки.
Большинство работает с ФР (если вообще) очень грубо, а сам файл допиливает в ФБЕ.
Так что желающих так подробно разбирать ФР по косточкам не так уж много.
Алекс, ты пойми меня, пожалуйста, правильно. Я не хочу тебя расхолаживать. И не хочу выглядеть брюзгой. Но мне кажется, что сейчас мы куда-то не туда свернули.
Наверное, это только начало пути и в конце концов мы доберёмся, куда нужно. Я даже почти уверена, что это так. Но мне хотелось бы определить наши цели и приоритеты.
Наше сотрудничество началось с той самой пресловутой точки в конце строки. После наладки и доработок получился приличный Споттер-2, который выполнял поставленную задачу, а заодно с ней и ещё парочку полезных вещей.
Сейчас мы на том же этапе со Споттером-3. И наверняка он в результате тех же доработок тоже будет замечательно справляться с поставленными задачами. Вот только задачи эти множатся. А мне это не кажется правильным.
Я считаю, что работать надо, в первую очередь, с fb2-файлом. Твоя революционная идея об обработке скриптами промежуточных файлов, полученных из ФР, помогла решить проблему, которую нельзя было решить другими способами.
Но зачем решать возникающие проблемы в ФР, когда их можно решить в ФБЕ, где и проводится основная работа над файлом?
Зачем к миксеру приделывать вентилятор и зажигалку?
Я очень надеюсь, что мне удалось внятно сформулировать свою интенцию. И самое главное, что я тебя ничем не обидела.
Протоколы? И шо - много протоколов?!
Для второго и третьего Споттеров (см. индексы в названии файлов). И pdf.
Сейчас выложу.
Отредактировано golma1 (2012-12-16 18:42:29)
Поделиться6062012-12-16 19:07:01
Споттером-3. И наверняка он в результате тех же доработок тоже будет замечательно справляться с поставленными задачами. Вот только задачи эти множатся.
Несомненно (речь о первом предложении). Задачи на самом деле не множаться (о втором). Их-то и не так много, как кажется:
- абзац может быть 3-х видов: нормальный, слипшийся, разорванный. Задача - их правильно идентицицировать.
100% правильно. Сноски - это тоже теже абзацы, только вид снизу. Так что всё идёт своим путём. В нужном направлении.
В FBE можно многое, но единственная незадача - не видно первоисточника, а он иногда позарез нужен.
Приходится возиться с PDF (например). С ПЧ - в этом смысле проще. И к тому же изнутри FB2-файла не всё видно, что именно не так.
А к обработке FB2-файлов мы ещё вернёмся. В обозримом будущем.
Поделиться6072012-12-16 19:21:22
А к обработке FB2-файлов мы ещё вернёмся.
Когда будут готовы две кнопки Вкл-Выкл, свистните
Поделиться6082012-12-16 19:54:17
В FBE можно многое, но единственная незадача - не видно первоисточника, а он иногда позарез нужен.
100%. Именно поэтому я интенсивно работаю с ФР.
Но ключевое слово - "иногда". Если для исключения того, что мне - возможно! - придётся из ФБЕ вернуться к ФР, скажем, 2 раза, я должна просмотреть 35 "ложных" срабатываний Споттера, то это не экономия сил и времени.
Понимаешь? Речь идёт о целесообразности.
Работая в ФБЕ, я так или иначе запущу определённый набор скриптов. И если он безошибочно работает, зачем мне его дублировать?
******************
Я с удовольствием и, честное слово, добросовестно (как и раньше) продолжу работу над Споттером-3. Но мне бы хотелось, чтобы ты меня услышал и понял.
Моя самая главная интенция: я считаю неправильным тратить время на проверку того, что в ФБЕ в любом случае обязательно будет проверяться. Мне кажется, что Споттер должен сконцентрировать свои усилия на том, что другим способом вычислить сложно или невозможно.
А это:
- разорванные на точке абзацы
- склеенные абзацы
Всё остальное для меня - тривиальные случаи разрыва абзаца, 99,9999% которых я исправляю в ФБЕ, запустив простой и удобный скрипт. В исчезающе малом количестве случаев мне приходится обращаться к оригиналу.
Поэтому листать Споттер, чтобы убедиться, что это - таки да тривиальный (в моём понятии) разрыв абзаца, мне не хочется. Вернее, просто жаль времени. Мне не нужна эта информация. Я её позже легко и просто получу нажатием одной (!) кнопки на панели ФБЕ.
***************
Знаю, что найдём общее и правильное решение.
Поделиться6092012-12-17 11:58:55
Моё почтение!
Эта... Вопрос! Продолжая натаскивать Наблюдателя, наткнулся в "Деннис Лихэйн - Прощай детка прощай" на такой пассаж (сноска на стр. 214):
1 Каан Джеймс — американский актер. Сыграл молодого Вито Корлеоне в фильме Копполы «Крестный отец».
Да, мельчают книглиздатели, халтурят; переводчики охламоны. Тута такое дело:
Каан Джеймс сыграл не молодого Вито (молодого Вито сыграл Де Ниро в Крестном отце-2), а персонажа Сантино (Сонни) Корлеоне
Учитывая п(р?)овальную эрудицию современного (в большей массе) читателя насколько уместно внести в электронную книгу правку?
Я бы внёс. С особым цинизмом. Из соображений перфекцмонизма.
Поделиться6102012-12-17 12:53:06
Я бы внёс.
Я бы тоже.
Сейчас напишу UTC - он вычитывает. Спасибо.
Только что тоже сделала сноску в книге Гир, которую вычитываю, по поводу неправильного перевода.
upd.:
Бу сделано!
Ещё раз спасибо.
Отредактировано golma1 (2012-12-17 13:01:21)
Поделиться6112012-12-17 13:01:46
Тем более, затрагивается только сноска, а не само произведение.
Поделиться6122012-12-18 12:16:33
Моё почтение!
Эта... В ходе "доведения проги до уровня пожеланий пользователей", столкнулся с аномальным поведение оной.
В связи с чем "рекламная пауза" эта... продолжается. Причин для беспокойства нет.
Всё будет, ясное дело, хорошо.
Поделиться6132012-12-19 11:50:59
В связи с чем "рекламная пауза" эта... продолжается.
Да? А я сегодня как раз закачиваю свою сложную книгу, начну, видимо, "нормальную".
У меня есть задание по Споттеру-3?
Поделиться6142012-12-19 12:44:38
Мой почтение!
Пока - да. Хватает недоработок. Устраняю.
У меня есть задание по Споттеру-3?
- нет, спасибо.
А вот случаи "слипшихся абзацев" - интересуют. Т.е. если будем много "слипшихся" - желательно выложить htm + txt+pdf.
Поделиться6152012-12-19 16:38:15
Т.е. если будем много "слипшихся" - желательно выложить htm + txt+pdf.
Договорились.
*хвастаеццо*
http://lib.rus.ec/b/408258
Поделиться6162012-12-19 19:52:14
Таким не грех пофастацца!
Как, впрочем, всегда - эталон качества.
В связи с этим, пользуясь случаем, замечу, что хотелось бы в новой библеотеке видеть именно такие по уровню исполнения книги. Лучше меньше, да лучше. Не тянуть всё подряд с других сайтов, выжидая n-тое кол-во дней, в т.ч. дублировать (о, Господи!) СИ. Нельзя же объять необъятное. Есть прекрасные картинные галереи: Эрмитаж, Третьяковка, Галерея старых мастеров в Дрездене , Лувр, Метрополитен-музей, Лондонская НГ и т.д. Но было бы странно, если среди представленных экспонатов фигурировали ксерокопии или журнальные редродукции, да даже копии экспонатов других музеев. Электронные библиотеки несколько иное, тем не менее..., ИМХО ест-но.
Поделиться6172012-12-19 22:13:20
Лучше меньше, да лучше.
Ну, эту точку зрения разделяют не все. Так что приходится всегда искать консенсус.
Если удаётся найти правильную пропорцию между отличными и так-себе-файлами, уже хорошо.
Поделиться6182012-12-19 22:15:07
В связи с этим, пользуясь случаем, замечу, что хотелось бы в новой библеотеке
Это вапщета в мечту надо
Поделиться6192012-12-20 23:48:24
В новой книге слипшихся абзацев не было.
Поделиться6202012-12-30 15:13:26
Моё почтение!
Эта... Такое дело... Объявляется (долгожданный?!) перерыв в "рекламной паузе"...
(Уря, товарищи!/Панфары/Бурные продолжительные аплодисменты, переходящие в овации/Скептическое хмыканье/Презрительное молчание/Проклятия, переходящие в нецензурную брань/ etc...)
А также, учитывая дату - типа "подарок к Новому году"!
Здеся: Прерыватель рекламной паузы
Кое-какие фрагменты кода глубоко переделаны, перекопаны, переосмысленны, перепрограммированны.
Многие глюко-баги, тоже это самое...
Улучшена дружелюбность...
Но какой ценой! - Добавились новые параметры в Spotter3.ini. Правятся руцями, из программы
можно менять "на лету" (обратной связи нет).
[PATH]
BookPath=D:\.... - уже было
[CALC]
FastCalc=0 - точный подсчет (рекомендуется)
[BREAK]
ByPage=1 - 0-не включать в протокол, 1-под спойлер, 2-в протокол
Inside=1 - аналогично
[COMMENT]
SpotterSay=1 - 1-под спойлер, 0-в протокол
[LOG]
LogCreate=0 - тоже уже было
Да, интерфейс тоже несколько переделан, но не перекопан.
Ес-но для улучшения ТТХ - прога должна подвергнуться "полевым испытаниям".
Best regards! Happy New Year!
Я внятен?!
Поделиться6212012-12-30 15:52:47
Best regards! Happy New Year!
Взаимно!
Пусть всё сбудется, как задумано, а не как получится.
Скрипт забрала, буду пробовать. Правда, в последнее время меня "балуют" такими книгами, что сам чёрт ногу сломит, но когда-нибудь же появится подходящий материал. Точно знаю.
Поделиться6222013-01-01 15:35:09
Алекс, с Новым годом!
Как встретил, как самочувствие?
Поделиться6232013-01-01 19:30:52
С Новым годом!
Моё почтение!
Спасибо, всё Ok-и В гостевом режиме, без эксцессов. Единственно, что было омрачило сначала - захватил с собой любимый Киндл и продолжил читать П.Леметра "Свадебное платье жениха." Ест-но (по закону "подлости") под конец 19-ой главы (когда ГГ беседовала с сержантом в ресторане, а тот ей - дескать вы мне всё время врёте...) наткнулся на явный обрыв текста - как раз один кусман в конце одной странице, а продолжение - на другой.
Я внятен?! Попытаться сменить номер шрифта в голову не пришло - и думал, ну что за "прикол"?! Уже дома, когда дорвался до инета - увидел в том месте empty-line... Хотя все равно, как-то странно: ни до ни после (пока во всяком случае) подобного "рваного" стиля не было.
Такое ощущение, что просто-напросто выпал один лист текста книги. Ну или издатель нахалтурил.
Продолжаю читать...
Поделиться6242013-01-01 21:22:21
Я саму книгу не читала, но сейчас глянула: в 19-й главе много пустых линий. Так и было в печатном экземпляре. Кстати, если ты читаешь "мои" книги, то у меня всегда к ним есть pdf с текстовым слоем.
Я пробую как раз новый скрипт.
Есть один момент, который я пока не могу задекларировать как глюк: нумерация страниц смещена на 1: то есть, в протоколе стоит 176, а в ФР это 177. Но там какая-то фигня была с самой первой страницей (странное сообщение о какой-то недоступности), я её удалила, поскольку там был только заголовок.
Я копирую проект ФР в твою папку и запускаю скрипт уже на файлах, сделанных из него. Может, эта страница где-то осталась висеть в каких-то "метаданных" (условно говоря).
Проверю на следующих.
В следующем постинге - вопросы/заметки.
Поделиться6252013-01-01 21:30:34
стр. 111 - "разрыв абзаца страницей"
спойлер, очень хорошо, поскольку это не на точке.
стр. 121 - "возможный разрыв абзаца страницей"
не в спойлере, хорошо, поскольку на точке (не очень подходящее название, на мой взгляд, но не суть)
стр. 176 - "разрыв абзаца страницей"
спойлер, плохо, поскольку разрыв на точке с тире. хорошо бы включить этот случай в "возможный разрыв абзаца страницей"
стр. 178 - "ошибка пунктуации"
не увидела, где.
Сделаю ещё один проход со споттером-2, просто для сравнения. Благо, файл небольшой.
Поделиться6262013-01-01 21:31:51
С номером страницы - беру назад. Оказывается, я не удалила её в исходном проекте ФР: там, где я произвожу изменения.
Поделиться6272013-01-01 21:41:28
Споттер-2 нашёл дополнительно:
стр. 52
— Я не говорила, что они уехали из Варшавы.
Но вы же все время звоните друг другу?
Спросил, не разрыв ли абзаца, оказалось пропущенное тире.
стр. 67 - разрыв абзаца страницей (на точке!)
стр. 240 - возможный разрыв абзаца (таки да):
— Рука руку моет, понимаешь? Иногда ему
нужна помощь крупных чиновников или полити-
ков, а иногда они хотят, чтобы он неофициально
решил какую-нибудь проблему... ЦРУ? Не знаю.
I [редставления не имею, кто за ним стоит — ЦРУ
или какие-нибудь другие спецслужбы.
Отредактировано golma1 (2013-01-01 21:42:03)
Поделиться6282013-01-01 21:58:08
Я саму книгу не читала
Правда?!
Как там в "Белое солнце пустыни" - "Как тебя понимать, Саид?!"
А как понимать сие?!: http://lib.rus.ec/b/406924
Впечатления о книге: golma1 про Леметр: Свадебное платье жениха (Триллер) 12-12-2012
Запутанная история, разобраться в которой можно, лишь дочитав последние страницы романа.
Оценка: хорошо
Действительно, запутанная история...Или написано с чужих слов?!
Конкренто речь идёт об этом месте:
— Да. Вы говорите себе: «Он неплохой парень со всеми своими средствами связи, но осточертел мне хуже горькой редьки», извините за выражение. Вы смотрите на часы, думаете о своем. Вам хочется оказаться в другом месте. Должен признаться, и мне тоже. Я с вами чувствую себя как-то неловко, понимаете. Вы стараетесь быть вежливой, а как же иначе, раз уж мы здесь… приходится разговаривать. А говорить нам особо не о чем. Вот я себя и спрашиваю…
— Извините меня, я отвлеклась, это верно… Просто в вашем рассказе столько технических деталей, понимаете…
— Дело не в технике. Главное, я вам не нравлюсь. Вот я себя и спрашиваю…
— И о чем же?
— Я себя спрашиваю, зачем вы мне позвонили. А? Чего вы на самом деле хотите? С вами-то что случилось?— Ну, это и год может продлиться, и два, и три. Некоторые вообще ее не получают. Моему приятелю просто повезло.
В какой-то момент они засмеялись. К концу ужина Софи уже не помнила над чем. Они шли вдоль реки. Резко похолодало. Через несколько шагов она просунула свою руку под его локоть. Мгновение общности сблизило их. В конце концов, он выбрал не самый глупый маневр: отказался блистать. И сказал нечто очень простое: «В любом случае, лучше оставаться самим собой. Ведь рано или поздно все равно выяснится, кто ты есть. Лучше уж узнать все сразу, верно?»
Обрыв после слов: С вами-то что случилось? И В этом месте всего ОДИН empty-line.
"мои" книги, то у меня всегда к ним есть pdf с текстовым слоем.
- этим я активно пользуюсь.
Расхождение в одну страницу с ПЧ, если таковое имеется, я-то тренировался на без ПЧ, легко "лечиться".
Категорировать на "под спойлер"/"не в спойлере" - тоже без проблем. В том случае посчитал, что последующее применение скрипта "06_Управляемое исправление разрывов абзацев" решит проблему. Поправимо. "Проколы" ещё встречаются. Работа над их устранением ведётся.
Насчет
стр. 178 - "ошибка пунктуации"
- всё ПЛОХО. Прога НЕ УВИДЕЛА НЕПРАВИЛЬНУЮ сноску!:
' Spaghetti al dente (am.) — спагетти «на зубок», чуть не...
- а увидела, что абзац начинается со строчной...
Этим и объясняется "пунктуация". Бум бороть!
Поделиться6292013-01-01 22:16:58
Споттер-2 нашёл дополнительно:
Мдя...
Сюрприз, однако...
Рекламная пауза!
Поделиться6302013-01-02 00:36:53
Кстати:
pdf с текстовым слоем.
- если быть точным - то правильно: pdf с ТАК НАЗЫВАЕМЫМ текстовым слоем. На САМОМ деле НИКАКОГО ТЕКСТОВОГО слоя в pdf нетЪ.
Быстрый ответ
Вы здесь » Графика » Остальные программы » Скрипты и регеспы