Графика

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Графика » Остальные программы » Скрипты и регеспы


Скрипты и регеспы

Сообщений 481 страница 510 из 1000

481

Pdf-ку поразглядывал...

Книга неординарная. Боюсь, что новый скрипт в ней растеряется.

- это надо смотреть (в первую очередь) как выглядит HTM-файл. Что из него мона извлечь.
А скрипт новый прийдёться (хочется все-же частично) писать на языке программирования.
Одни скрипты не прокатят - во-первых гораздо шустрее, во вторых java-скрипты "глохнут", если начать в них массив наращивать - происходит борьба: с одной стороны браузер (система) пытается освободить память, с другой - по алгоритму задачи нужно запоминать данные в массиве. Как следствие - ругань, что дескать скрипт замедляет работу системы. (Конкретно к spotter-у - нужно как-то привести в одному знаменателю два файла - тхт и htm. Без массива - никак  http://fludu.h1.ru/Smiles/no2.gif ).
С Delphi, слава богу, знаком. Но нужно сделать в виде dll-лины, да "прикрутить" скрипт, ну чтобы каждый раз проект не компилять, и алгоритм обнаружения "бяк", "засунуть" в это скрипт. Я внятен?!

Отредактировано Alex2L (2012-10-24 22:15:52)

482

Готово:

https://www.rapidshare.com/files/544920026/Uinslou.rar

483

Alex2L написал(а):

Я внятен?!

Вообще нет. o.O

Или, вернее, ты-то, наверняка, внятен, а вот я в этом всём абсолютно ничего не понимаю.  :dontknow:

484

http://fludu.h1.ru/Smiles/pardon.gif

А эта... распознавание Прекрасным Чтецом изначально происходило и этой вот pdf-ки?
Имею в виду, что FR-пакет в какой-то степени отредактированный?

Отредактировано Alex2L (2012-10-24 23:01:21)

485

Моё почтение!  http://fludu.h1.ru/Smiles/sm405.gif

Вчерашний вопрос - снимается. Выкусил из пакета bmp-хи, перераспознал, сохранил в тхт- и htm-файлах.

Теперя новый вопрос-просьба: хотелось бы (во избежании потерь времени) ткнуть носом в скажем в пяток примеров слипшихся абзацев?! Ну шобы самому не выискивать? http://fludu.h1.ru/Smiles/blush2.gif

Please! http://fludu.h1.ru/Smiles/thank_you.gif

P.S. Все слипшиеся не надо! Можно по-простому - типа см. номер стр. (книжно-бумажной) такой-то.

Отредактировано Alex2L (2012-10-25 10:22:37)

486

ФР делался из сканов. Из них же делался pdf (силами Акробата).

Насчёт примеров - чуть позже: нужно пересесть на другой компьютер. Но сначала надо закончить работу. ;)

487

Ок! Жду...

А эта...

ФР делался из сканов. Из них же делался pdf (силами Акробата).

на каком этапе в pdf-е образовался т.н. "текстовый слой"?!

Исходя из написанного, Акробат своими силами из сканов смастерил pdf с т.н. "текстовым слоем"? Т.е. он умеет OCR-ить? o.O

Или pdf-ка сохранялась таки ПЧ, а потом "рихтовалась" Акробатом.
Или в Акробат был "подпихнут" распознанный текст?
Если так - то вопросов нет.

Отредактировано Alex2L (2012-10-25 11:28:43)

488

Поглядел. Однин слипшийся абзац на стр. 136 сам увидел:

Самое противное, что она этого вовсе не хотела.
    Елена даже и не собиралась возглавлять картель.

- типа этот случАй (в т.ч.) имеется в виду? Хм!
http://fludu.h1.ru/Smiles/secret.gif Там есть за что цепляться! :)

489

На самом деле случаев дофига и чуть больше. :)
Ищется поиском: .^l

Сразу (в скобках номер страницы в ФР):
— Впрочем, тебе это даже идет, — добавляла она. Зато у меня нет психованного папаши, который (7)

Другие, подумал Чон и вспомнил о Сартре1. Дом, где живет Бен, (10)

— Впрочем, дело твое, — пожал плечами Чон. Вытащив зажигалку, О разожгла кальян (13)

— Видимо, все дело в травке, — предположила О. Травка — чудесная штука, не стал спорить с ней (18)

— Это кто тебе такое прислал? — спросила О. Может, это очередной вирусный (21)

Впрочем, в тот момент она была укурена в хлам. Но доля истины в ее словах есть. (21)

Возьмем, например, слово “дикарь”. Единственное число от слова “дикари”. (21)

Но мы-то знаем, что ты, Чон, гораздо их умнее. Смотри запись и мотай на ус. (23)

1. Лишиться бизнеса. г. Лишиться головы. (25)

Реабилитационные клиники. Политики-республиканцы. (26)

Фитнес, политики-республиканцы и Иисус. Пластическая хирургия. (26)

как они решили сами разбогатеть. Говорите, у Ладо глаза холодные, как камень? (32)

— Доставай пушку, — велел Ладо Эстебану. Парнишка вытащил пистолет из кармана. (41)

И т. д.
Возможно, среди приведённых есть те, которые нашёл скрипт - я искала по неисправленному документу ФР. Но если ты и дальше будешь искать по .^l, проверяя при этом положение курсора в окне "Крупный план", то найдёшь ещё кучу. :) (Если курсор стоит в конце абзаца - это ошибка, т.е. склеенный абзац).

490

Ага. Спасибо! http://fludu.h1.ru/Smiles/thank_you.gif

Наиболее тяжелые случаи, типа:

— Впрочем, дело твое, — пожал плечами Чон. Вытащив зажигалку, О разожгла кальян (13)


Впрочем, дело :) не такое уж и безнадёжное.

Что куча - верю! Искать - не хо http://fludu.h1.ru/Smiles/nea.gif
Пущай будущий скрипт ищет - файлы занесены в тестовый случай, наряду с биографией Агаты.

491

Alex2L написал(а):

Пущай будущий скрипт ищет

Ага, пускай.  :yep:

492

В сегодняшнем файл "параграф-интерактив" таки нашёл пропущенное тире. И всего 2 ложных срабатывания. :cool:

493

Моё почтение!  http://fludu.h1.ru/Smiles/sm405.gif

В сегодняшнем файл "параграф-интерактив" таки нашёл пропущенное тире. И всего 2 ложных срабатывания.

уря! Наконец-то!

Э... ну мона так и пользоваться пока. Учитывая, что скрипт (на взгляд со-стороны) работает типа: "то-ли дождик, то-ли снег..." и собс-но позволяет "довылизать" файл (при желании), то есть встречное желание (и, пожалуй, возможность) "встромить" это дело в новый spotter. Хотя, с другой стороны, нужен-ли tiret понятно интуитивно, и в "первоисточник" мона и не заглядывать. Если бы еще чем набить?!  http://fludu.h1.ru/Smiles/dntknw.gif

494

Не думаю, что их надо объединять.
Споттер - для ФР, а ПИ - для ФБЕ.

Кроме того, не думаю, что споттер нужно "перегружать". Всё-таки проверка предполагает переключение между двумя документами, введение номера страницы, нахождение нужного места...

В ФБЕ со скриптами работать намного комфортабельнее. Поэтому я бы оставила ПИ - для ФБЕ. Другое дело, что в него можно было бы "напихать" ещё что-нибудь. Но пока идей нет...  :dontknow:

495

Может быть и так. Просто этих скриптов-то (в FBE) хватает (судя по переписке в либре книгоделы умудряются в них путаться  http://fludu.h1.ru/Smiles/mosking.gif ), или теряют их.

Интересно, если (выложить для всех и) кинуть клич - "даёшь идеи!" - пожалуй, на призыв golma1 народ не откликнуться не удержится http://fludu.h1.ru/Smiles/grin.gif
А вдруг, кто-нить что-нить да и изложит (внятно, само-собой)?!

Отредактировано Alex2L (2012-10-26 19:17:13)

496

Alex2L написал(а):

Интересно, если (выложить для всех и) кинуть клич - "даёшь идеи!" - пожалуй, на призыв golma1 народ не откликнуться не удержится

Можно попробовать. :)

Надо выложить тогда последнюю версию ПИ, рассказать, что она делает, и сказать, что принимаются идеи (sic!, а не пожелания) по поводу того, что можно было бы новому скрипту "поручить".
Сделать тему на Л.?

497

Последняя от позавчера. (v.1.04 [24-10-12] — доработан алгоритм обнаружения) Или перевыложить?!

Акцентировать (ИМХО) нужно на том - что выявленный случай - не обязывает бездумно менять. Иначе это был-бы другой скрипт - типа: "тынц и готово!". И идеи именно в этом же ключе - типа "вот сталкиваюсь с чем-то довольно регулярно, а что поделать не знаю...". Скорее всего, большую часть из изложенных идей прийдёться похерить (отложить до лучших времен), а часть - как знать. Почему бы нет?!

Отредактировано Alex2L (2012-10-26 19:52:52)

498

Ок, сделаю.
Но чуть позже. Завтра гости приезжают - некогда будет участвовать в форуме. А без присмотра не хотелось бы...

Если забуду, напомни. Гости в среду уезжают. ;)

499

Моё почтение! http://fludu.h1.ru/Smiles/sm405.gif

Я, здеся, эта... подумал... А куда собс-но торопиться?! Тута и так столько всего недоделано. Может эта... отложим мероприятие до лучших времён?! Ну, например, после spotter-3 или "метаграмма-контекст"? Все проблемы сразу всё одно не порешать...

Я внятен?!

500

Alex2L написал(а):

Я внятен?!

УполЬне.  :flirt:

Верная мысль. Так и сделаем.

501

Алекс, идея от SunnyCat. Мне нравится. ;)

Снять всё форматирование, оставив только разметки абзаца. А ещё лучше: снять форматирование, оставив - на выбор! - структуру.
Подумаешь?  :flirt:

502

Приветствую!

Алекс, идея от SunnyCat. Мне нравится.

Снять всё форматирование, оставив только разметки абзаца. А ещё лучше: снять форматирование, оставив - на выбор! - структуру.
Подумаешь?


Ничего не понял! http://fludu.h1.ru/Smiles/wacko2.gif О чём собс-но речь?! О FBE?
И гиде SunnyCat изложила по-конкретнее эту идею? Ну снять, а потом?!

Подумать - обещаю! Когда пойму о чём! http://fludu.h1.ru/Smiles/blush2.gif

503

Alex2L написал(а):

О чём собс-но речь?! О FBE?

Да.

Alex2L написал(а):

И гиде SunnyCat изложила по-конкретнее эту идею?

Лично мне.

Alex2L написал(а):

О чём собс-но речь?!

Есть файл fb2 - с кучей форматирования: стихи, цитаты, какие-то секции, титлы, субтитлы, курсив, полужирный, верхний/нижний регистр. Исправлять каждый фрагмент утомительно и непродуктивно.

Хочется: убрать всё форматирование. Пусть останется голый текст только с разбивкой на абзацы. Желательно иметь выбор - сохранять структуру или нет (а вдруг она хорошая?).

Я внятна? http://fludu.h1.ru/Smiles/dirol.gif

504

Моё почтение!  http://fludu.h1.ru/Smiles/sm405.gif

Я внятна?


Канэш!  А то эта... закралась мысль, что мол golma1 на мазохизм потянуло...
Ломать - не строить! Т.е. - всё взять, да и похерить?! Pourquoi бы и не pa!
Единственный нюанс - а как быть с примечаниями? При таком раскладе - они тоже, эта... товой! http://fludu.h1.ru/Smiles/pardon.gif
Может стоит перед этим скриптом выполнить "01_Перенос примечаний в скобки.js" ?!

505

Alex2L написал(а):

Может стоит перед этим скриптом выполнить "01_Перенос примечаний в скобки.js" ?!

Хммм... Не подумала о примечаниях.  :blush:
Да, это было бы полезно. А то потом расставлять их было бы весьма затруднительно.

На самом деле, этот скрипт нужен для старых файлов, конвертированных программкой any2fb2. По умолчанию она фигачит стихи где ни попадя, а настройками редко кто заморачивается.
Кроме того, бывают книги, где части слов распознаны болдом или курсивом (ошибочно).

В общем, это не такой скрипт, который непременно нужен для изготовления хорошего файла, но он очень поможет в определённых ситуациях.  :flirt:

Отредактировано golma1 (2012-10-31 17:39:15)

506

http://fludu.h1.ru/Smiles/secret.gif Мусорщик

Ликвидация последствий форматирования книги.  :)
Сильно не тестировал. Навскидку - работает, как заказывалось.

ЗЫ. Htm-файл, ес-но нужно закинуть в соответствующую директорию

Отредактировано Alex2L (2012-10-31 17:47:25)

507

Моё почтение! http://fludu.h1.ru/Smiles/sm405.gif

Отсутствие комментов насчет скрипта "Ликвидатор" несколько озадачивает.  http://fludu.h1.ru/Smiles/scratch_one-s_head.gif
Никаких доработок не нуна?

Теперь эта... Как оказалось, "Другое Место." Рассказы [Авторский сборник] Дж. Б. Пристли,
очень хороша для ловли "блох". Откопал, в ходе неспешного чтения ещё одну:

Хуберт заставил себя не слушать этот разговор и отошел от стойки на несколько шагов. Он больше не мог выносить этот бред. Лучше уж действительно вернуться в квартиру, поболтать со стариной Джоном. Он вздохнул. Вероятно, ему придётся смириться смириться с тем, что вечер окончен, и двигаться к дому. Как и прежде, кофейная стойка не подарила ему ничего волнующего и романтичного. Он пригубил кофе и обнаружил, что он еще горячее и приторнее, чем обычно. Что за жизнь!


- это из рассказа "ПРИКЛЮЧЕНИЕ" (12-й абзац сверху). Понятно, что это скорее всего ошибка
аналогового первоисточника (сиречь бумажной книги). В пятом-то предложении. Немного покумекал - доработал свой "Параграф-интерактив" - теперя ловит и ситуёвину: одно и тоже слово (с учетом регистра) подряд через ПРОБЕЛ.
Забавно, что "улучшение" на времени работы скрипта сказалось совсем незначительно. Понятно, что такой случАй
дублирования слов крайне редок, но тем не менее некароший случАй. А ловился только вычиткой.
А теперя...  http://fludu.h1.ru/Smiles/sarcasticaa9.gif
Итак - тута: улучшенный "Параграф-интерактив".

Еще плюс - отработан алгоритм выделения отдельных (всех) слов в предложении. Пригодится в будущем.

508

Alex2L написал(а):

Отсутствие комментов насчет скрипта "Ликвидатор" несколько озадачивает.

Прости, ради бога. Я каждый раз заглядываю, вижу - новых сообщений нет, нуивот.  :dontknow:

А предыдущее, видно, как-то пропустила.  :blush:

Большое спасибо за скрипт. Только отзывы скоро не жди. Разве что специально поиграться. Он для редких случаев. Но уж тогда - дороже денег.  :flirt:

"Параграф-интерактив" пользую, спасибо за новую версию. Правда, он срабатывает редко - у меня очень(!) хорошие сканировщики. :love:

509

Сразу докладываю.

"Мусорщика" сразу пристроила SunnyCat - ей часто надо.
Отзывы:

[21:53:18] SunnyCat: Ай ты моя зайка, хорошо то как!!! Вот спасибо от меня огроменное преогроменное!!!

[21:53:34] SunnyCat: Рай, чиста рай :))))

[21:54:01] SunnyCat: спасибо большое :))


А вот улучшенный Параграф-интерактив что-то сбоит. :(

Опробовала его на файле http://lib.rus.ec/b/396722

Один раз сработал правильно: увидел "Гумберт Гумберт", а два других "одинаковых слова подряд" - ошибка.
И странная фокусировка выделения: в правильном случае - на запятой, перед "я не Гумберт Гумберт".

Посмотришь?  :flirt:

510

Моё почтение! http://fludu.h1.ru/Smiles/sm405.gif

Посмотрел и  подправил - сбоить перестал.
Версию менять не стал.

SunnyCat стало быть порадовалась? Ну и отлично!  http://fludu.h1.ru/Smiles/smile3.gif


Вы здесь » Графика » Остальные программы » Скрипты и регеспы