Графика

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Графика » Остальные программы » Скрипты и регэкспы часть II


Скрипты и регэкспы часть II

Сообщений 271 страница 300 из 459

1

Топик по скриптам, регэкспам и прочим полезным вещам в практике книгоделов.

Полезности
Перенумератор ссылок в FB2 файлах (читать READ ME!)
PopChar 5.5.2 для вставки любых символов в текст (портабельная)
CompareIt! 4.2.2221 для сравнения двух файлов (портабельная)
ACDSee 5 самый маленький и быстрый вьюер/редактор для основных типов графики (портабельный)
Scholar 1.0 + ORFO 2010 portable
Scholar 1.0.2 portable (если нужно, то ORFO 2010 берется из ссылки выше)

Отредактировано GMAP (2013-05-08 18:55:20)

271

Моё почтение! http://fludu.h1.ru/Smiles/sm405.gif
http://fludu.h1.ru/Smiles/secret.gif  крайний из третьих
Перетрахнул алгоритм обнаружения разорванных/слипшихся абзацев и пр.
Значительно уменьшено кол-во нелепых утверждений.
Удалена формулировка "Очень подозрительный фрагмент текста!!!"
Катимся в сторону где лучше, ИМХО!  http://fludu.h1.ru/Smiles/yes3.gif

Допускаю, что невнятен! http://fludu.h1.ru/Smiles/pardon.gif

272

Спасибо.
На следующем проекте попробую. :)

273

Новую версию опробовала. Понравилась. :)

274

Моё почтение! http://fludu.h1.ru/Smiles/sm405.gif

golma1 написал(а):

Понравилась.

Ну и слава богу!
В таком случае дальнейшая разработка Spotter-3 прекращается.

275

Моё почтение!  http://fludu.h1.ru/Smiles/sm405.gif
Эта... Обнаружил (и устранил) пару блох, которые, похоже, абсолютно не влияют на конечный результат.
Поэтому выкладывать новую версию смысла не вижу. Если, конечно, предыдущая по-прежнему нравится.

Я внятен?! http://fludu.h1.ru/Smiles/sarcasticaa9.gif

276

Приветствую, коллеги!
Вариант программы Грамотей-Экспресс на основе Hunspell-словарей: http://ge.tt/6ZPqrfw/v/0

В архиве: Scholarplus.exe - собственно программа, 
Scholar.ini - пример файла настроек. Добавлен параметр:
  DictPath = C:\Program Files\FictionBook Editor\Dict\ru_RU.aff - т.е. указан путь к словарю

hunspell.dll - необходим для работы (желательно либо зарегистрировать в системе, либо положить рядом с exe-файлом)

Папка SpellTest - не менялась. На всякий случай перевыложена в виде SpellTest.zip http://ge.tt/4KTrsfw/v/0

Идея и hunspell.dll взято отсюда:  "Проверка орфографии в Delphi с помощью библиотеки Hunspell"
http://delphiway.ru/проверка-орфографии … ью-библио/

Слованый запас несколько иной, чем в ОРФО. В основном за счёт имён Собственных, зато работает гораздо шустрее,
устанавливается проще и обходится без записей в реестр.

Немного о многоязыковой проверке. Можно воспользоватся опытом, изложенным в статье
"Многоязыковая проверка орфографии для программ, использующих Hunspell"
http://habrahabr.ru/post/158441/

- не пробовал. Должно работать. Достаточно громозко.
Есть второй вариант. Простой, как дрова. Доработать программу до уровня Грамотей-Полиглот :)
Т.е. добавить кнопку выбора словарей. Скажем, русский, потом аглицкий, испанский и т.д.
Сперва (как сейчас) производится частотный анализ - итого (к примеру) в книге 200 000 слов. Из них уникальных
50 000. Из которых (при проверке русским словарём) неизвестными остались 1 000. Далее енту 1 000 преверяем аглицким словарём.
Если в книге есть правильные аглицкие слова (в ентой 1 000) - стало быть, отсееиваем и их. Оставшиеся проверяем (в данном случае)
испанским словарём и т.д. В итого (возможно) имеем что-то вроде 800 неизвестных слов. Потом глазеем на них. :)

Есть ещё вариант "прикрутить" чек-бокс "ё --> е" - т.е. динамически превращать слова с русской "ё" в "е" (ежели словарь непонимает "ё").

Другое дело, что Грамотей по-прежнему только фиксирует ошибки, которые нужно править руцями с помощью иных программ.

Я внятен?!

277

Второй вариант очень интересен!
На работе работает(Win 7x64), правда периодически подвисает - русским  словам без проблем делает подсветку, а вот если потом выбрать цифры и английские слова - все... завтра могу выложить скрины.
Теперь дома(Win 7x64 не лицензия) - запускается (даже авира перестала ругаться!!!), но обработку fb2 отказывается делать:
http://s017.radikal.ru/i433/1310/66/8d500fa430e9t.jpg

Отредактировано Evgeniy_V (2013-10-30 20:20:17)

278

Ага... На самом деле это подзависает/глючит не сама программа, а собс-но обработка протокола scholar.hta. Т.е. "собака порылась" в frombook.js
Мне бы его где-нить глянуть. Можно посоветовать проверить на другой книге, по сравнению с предыдущим Грамотеем в детектирование слов внёс некоторые изменения, возможно прийдётся откатиться назад.
А по скриншоту - надавить продолжить выполнение сценария т.е. "Да" не помогает?!
Хотя... лучше выложить frombook.js + fb2-файл книги, т.к. var myStat = new TAFFY([ (на что "ругань" на скриншоте) - это вторая половинка frombook.js (текстовый файл, открывается редактором, даже кодировка - ANSI)

279

так яж не одну книгу гонял - ошибка одинакова по строке и символу...
Откатываться не надо - на работе же работает... почти:)
файлы вот http://ge.tt/api/1/files/6FoIYkw/0/blob?download
Ага - глючит открытие готового файла js...

Отредактировано Evgeniy_V (2013-10-30 20:29:38)

280

Хм! По-видиму связано с Win 7x64. Странно файл frombook.js - вполне себе нормальный. У меня Win 7x32 открылось без проблем в любой комбинации русские - цифры - иностранные слова. А что с версией 1.02 проблем визуализации не было?! http://fludu.h1.ru/Smiles/wacko2.gif
Scholar.hta запускается по "тюк-тюк" независимо не от чего. В  frombook.js собственно java-база данных. Пороюсь, что пишут на этот счёт. Странно!

281

Так-с. Можно (вреда не будет) скачать с сайта разработчика http://www.taffydb.com/ новую версию. Слева download и taffydb-master.zip. Из него извлечь taffy.js и переписать поверху одноимённого в папке js. Возможно, поможет. Я заменил у себя - разницы не заметил - и так работало. Но пусть будет свежая версия.  http://fludu.h1.ru/Smiles/yes3.gif

И ещё... Я тут подумал... В принципе некорректная запись и может "собака порылась" - недоработка программы(?). Полагаю решаемо...
О чём речь? Отредактируй frombook.js в строке 483 убери ПОСЛЕДНЮЮ запятую (имеется в виду тот файл, который ты выложил)
{id:3650, text:"— Спокойно, сынок. Вспомни, как сам первый раз шташа в виде пенька увидел. Вот и они тоже офона… озадачились, — постарался я успокоить малыша.", MultiM: [""], SingleM: ["офона"]}, 
Вот её убери!
И (за компанию) в 1116 строке:
{Snitch:"Строка: 1685", cWord:"Яджина", Counter:2},
Тоже эту крайнюю запятую убери! Наверное для 64-хбитки это критично.

Я внятен?!

282

Версия 2.02: http://ge.tt/8T3WClw/v/0
Устранена ошибка формирования лишней запятой. Весомая ошибка. http://fludu.h1.ru/Smiles/blush2.gif
Ну и SpellTest.zip http://ge.tt/87r5Dlw/v/0 с обновлённой taffy.js.
Удачи!

283

Приветствую! http://fludu.h1.ru/Smiles/sm405.gif
Дома и на работе все работает... однако на работе, при большом желании всеж удалось "убить" программу - при довольно быстром переключении подсветки(каждый раз очищая выбор) с русских на английские слова и цифры...http://fludu.h1.ru/Smiles/blush2.gif но это наверное не критично - просто информация к размышлению...
http://s020.radikal.ru/i720/1310/2d/8db7b8a8534ft.jpg
http://s020.radikal.ru/i716/1310/52/781aa9d1124dt.jpg
Если нуно - вот файлы.
Такой вопрос: Out_Path = D:\Tools\Autoran\Библиотека\Граммотей II\SpellTest\ - не влияет ли кириллица в пути программы?
И еще - заметил, что если обработать маленький файл, а затем пока Грамотей не закрылся открыть еще один файл - Грамотей ломится в интернет...

284

Приветствую! http://fludu.h1.ru/Smiles/sm405.gif
"Убивается" не программа, а сценарий обработки, прописанный в version2.js. Написанный на javascript. Допускаю, что можно "ковырять" в плане блокировки "быстрого переключения". Но стоит ли?
Если работает, полагаю кириллица в пути - некритична.
А насчёт "ломится в интернет" - хм... Сам Грамотей ломится не должен, а вот, если в этот момент открыто окно с протоколом - т.е. подключены javascript-ы из папки js, а именно  jquery-1.6.2.min.js,  jquery-ui-1.10.1.custom.min.js,  jsonlib.js,  taffy.js, то гарантировать, что некоторые из них не ломятся, не могу.
А куда ломится хоть? http://fludu.h1.ru/Smiles/swoon.gif

285

IP назначения - 239.192.152.143

286

Забавно... Если верить http://ip2geolocation.com/?ip=239.192.152.143, то где-то в Атлантике.http://fludu.h1.ru/Smiles/sarcasticaa9.gif
Может Hunspell.dll ломится? http://fludu.h1.ru/Smiles/dntknw.gif
Обнаружил ещё ошибочку - после обработки fb2-файла, программа его "держит". Повторно открыть нельзя. Это лажа. Может как-то связано?! Скоро выложу 2.03...
А тут: http://otvety.google.ru/otvety/thread?tid=11ec26ba2717bc64&table=/otvety/label?lid=413a6d7b508542aa&tab=wtmtoo&sort=wsmopb&order=wsnoa&start=400
пишут про торренты. Торрет-клиент установлен? Может как-то хитро взаимодействуют?

287

Версия 2.03 http://ge.tt/9lyr4ow/v/0
Решена ошибка с "удержанием" обработанного файла.

288

Установлен и даже активен:)
Ага - заметил - если попробовать открыть уже отрытый файл - говорит что нет такого...
Меня вот смущает - пока не закрылось окошко выбора, есть существенное торможение в окне протокола при выборе, по нескольку раз надо "тыркать"... или так и должно быть?
И еще - при нормальной работе - поиске неправильных слов... все нормально, а вот если из вредности начать быстро тыркать на ошибках - hta начинает тормозить и может совсем зависнуть - причина в этом, а не в поочередном выборе латиницы и кириллицы...
Торрент выключил, на подвисание не повлияло

Отредактировано Evgeniy_V (2013-10-31 13:42:21)

289

То что бывает по нескольку раз "туркать" нужно - сам замечал. Тут такое дело - внешний вид протокола (и внутреннее наполнение) реализовано с помощью сторонних библиотек. И поведение больше зависит от них (моего кода там достаточно мало). Вот попробовал подменить jquery-1.6.2.min.js (который сейчас) на jquery-1.7.2.min.js - внешне не изменилось. Может там и есть какой косяк http://fludu.h1.ru/Smiles/dntknw.gif
А что на 2.03 после одной обработке при выборе следующей книги - по прежнему ломится в Атлантику? Можно сделать так - после обработки fb2-файла кнопка "Выбрать" блокируется и можно только на статистику поглазеть, а для новой книги рестартовать программу. При однократном выборе, так понимаю, никуда не ломится?

290

Не знаю мож и пытается ломиться, только я уже не вижу comodo создал правило и уже не кажет, тупо блокирует...
Может дашь jquery-1.7.2.min.js - тоже попробую...
Да и можно наверное заблокировать кнопку выбора, а то мало ли... у нас же много шаловливых ручек http://fludu.h1.ru/Smiles/mosking.gif

291

Scholar_jquery.zip - версия 2.04 (с блокировкой) + jquery-1.7.2.min.js  http://ge.tt/1ph6Oow/v/0

На странице http://jquery.com/ - разные есть. Не факт, что любая подойдёт.

Если попробовать с jquery-1.7.2.min.js, то мало его в директорию js переместить, нужно ещё в
scholar.hta найти строку с упоминанием jquery-1.6.2.min.js и исправить:

<script type="text/javascript" language="javascript" src="js/jquery-1.7.2.min.js"></script>

292

А jquery-1.10.2.min.js не пробовал?
попробовал... после обработки файла, выдает:
http://s57.radikal.ru/i156/1311/0d/dfa87866a3b6t.jpg
1.7.2 и 1.6.2 выдает похожее окно:
http://s45.radikal.ru/i109/1311/27/eb589c867fe7t.jpg
если в тексте выбрать просмотр слова с символом "*":
http://s019.radikal.ru/i625/1311/c8/5b80b2f4ab2et.jpg
файл гонял один и тот же...

Отредактировано Evgeniy_V (2013-11-01 08:53:11)

293

Evgeniy_V написал(а):

А jquery-1.10.2.min.js не пробовал?

Не пробовал. По-первых, если не тыркать лихорадочно, и с jquery-1.6.2.min.js вполне нормально работает. Тем более работа по выявлению ошибок не продполагает спешки.  http://fludu.h1.ru/Smiles/sarcasticaa9.gif Во-вторых, прочие модули, скажем, jquery-ui-1.10.1.custom.min.js (отвечает в т.ч. за интерфейс, кстати) или jsonlib.js могут оказатся несовместимы с более старшими версиями jquery. А вот подсунуть (с соответствующими правками scholar.hta - ранее упоминал что да где править) лучше .min.js версии - сократится (в какой-то степени) время на загрузку. В-третьих появилась одна мысль... Надо подумать...

Я внятен?!

294

Абсолютно! http://fludu.h1.ru/Smiles/wink3.gif

295

Evgeniy_V написал(а):

если в тексте выбрать просмотр слова с символом "*":

* считалась неотъемлимой частью слова, т.е. не входила в разделители, типа !?;:., и т. д.
Исправил, версия 2.05 : http://ge.tt/7eAbStw/v/0

296

Поразмышлял... Если * "прилипла" к слову - это лажа! Так что вернул в новой версии, как было ранее, а вот version2.js рихтанул. Надеюсь объяснять не надо куда её нужно приткнуть?
Здеся: http://ge.tt/4HdIfuw/v/0

297

http://fludu.h1.ru/Smiles/good.gif
Я вот тож подумал что прилипшая "*" - косяк, но сказать не успел - забрали по работе...

298

Приветствую, коллеги! http://fludu.h1.ru/Smiles/sm405.gif
Сообщение 271 месячной давности, насчёт  Spotter-3 версии 2.52 - судя по статистике 9-ть раз скачано. Голме понравилось. Т.к. более отзывов не было, закрадывается подозрение, что понравилось так сильно, что решила скачать многократно.  http://fludu.h1.ru/Smiles/sarcasticaa9.gif
Шутю я, шутю... (с)

Такое дело! Для отработки алгоритма Spotter-4 остро необходимы пара-тройка свежих боеприпасов (в виде txt+htm+rtf+pdf-файлов в архиве). Но!!!
Rtf-файлы нужно сохранять со следующими опциями:
http://s7.uploads.ru/CJdoF.jpg

Т.е. "Оформление" - ТОЧНАЯ КОПИЯ, СОХРАНЯТЬ КОЛОНТИТУЛЫ, СОХРАНЯТЬ ДЕЛЕНИЕ НА СТРОКИ, ВЫДЕЛЯТЬ НЕУВЕРЕННО РАСПОЗНАННЫЕ СИМВОЛЫ
Прежние (в сообщении 221 от 20-го 8-го с.г.) НЕ ГОДЯТСЯ!!!
Жду! (с)

Я внятен?!

299

Alex2L написал(а):

Если, конечно, предыдущая по-прежнему нравится.

По-прежнему нравится, зашла специально, чтобы об этом сообщить.  http://fludu.h1.ru/Smiles/60e5b04866d90e6324fc14d0ab03e193.gif

300

Alex2L написал(а):

Жду! (с)

О, дошла до этого сообщения.

Вот один пример. При случае пришлю ещё.

Файлы

Быстрый ответ

Напишите ваше сообщение и нажмите «Отправить»



Вы здесь » Графика » Остальные программы » Скрипты и регэкспы часть II