Форум » Милитера (militera.lib.ru) » Пожелания и идеи » Ответить

Пожелания и идеи

Hoax: Тут собираются пожелания и идеи для родящейся сейчас новой Милитеры (как базы данных). Кое-что можно будет добавить сразу, кое-что — прикрутить после. Раз вы это читаете, значит вам это интерсно. В общем, необходимо ввести в БД большой массив информации — собственно всё то, что сейчас висит на сайте: сперва титульные листы, потом страницы. На это уйдёт немало времени, хотя его объём зависит от числа операторов. Возможно, какое-то время будет две параллельные Милитеры, я пока не придумал. Надо будет сперва ввести в базу только титульные листы книг, а страницы пока останутся в html, и постепенно будут подгружаться в БД. Такой вариант отнимет намного меньше времени, в пределах пары недель. Во всяком случае, с начала следующей недели нужны будут комсосольцы-добровольцы любых возрастов, причём знания HTML от них не требуется, всё просто, как мычание... ну, может быть, как художественное мычание. От них требуется ответственность и точность.

Ответов - 22

sdh: а можно ли будет в БД массово ошибки исправлять? типа "вражеские тапки"?

Hoax: Можно будет.

sdh: Ну тогда я готов, как и всегда ;) дома adsl с бесплатным уплоадом


xogok: А можно ли будет скачивать книгу не только одним файлом, а и так, чтобы после распаковки html-часть книги была одним файлом, а не несколькими, по главам, как сейчас? А то посмотрите, что происходит: многие книги с милитеры перевыкладываются на www.fictionbook.ru -- и в лучшем виде, чем на самой милитере. Кроме того, там картинки вставлены в текст, как и в оригинале книги, а не открываются по нажатию на какие-то ссылки. Хотелось бы, чтобы такой принйип оформления книг нашёл себе место и на милитере.

Hoax: Будет выбор -- для скачивающего. Либо качнуть заархивированную директорию с файлами внутри, либо целиком, например в chm формате. Насчёт картинок дать подумать. Примечания пока (пока) решено делать в виде всплывающих подсказок (на java)...

xogok: на java -- это очень здорово. Говорю так потому, что мною уже написан и отлажен соотв. скрипт. Пример можно посмотреть в высланной мною вам книге "Боевая работа советской и немецкой авиации в ВОВ" (по моей просьбе она выложена и в сети одним товарищем; при необходимости могу ещё раз выслать или линк сообщить); кроме того существует простенький скрипт, показывающий/убирающий номера страниц. Всё это инкорпорировано в э-книги, которые я делаю, и хотелось бы, чтобы эти "фишки" были "приняты на вооружение" милитерой. Это же удобно!

xogok: мне кажется, это не здравая идея. chm, как и mht, обладает несомненным преимуществом -- однофайловостью, однако при попытке его отредактировать (чтобы заменить одну букву например) возникает такой геморрой!.. Надо распаковывать, потом снова запаковывать... В то же время html редактируется сразу и непосредственно, а если хочется это всё представить одним файлом -- можно заrar'ить -- и всё (для пересылки, к примеру). Предложение же о том, чтобы весь текст книги был в 1-м html-файле порождено двумя обстоятельствами: 1) В единственном файле удобно искать ключевые слова (например, найти все случаи фамилии "Покрышкин"); 2) При массовой замене ("тапки"--> "танки") или " оп " --> " он " опять же удобнее один раз применить эту операцию к одному файлу, чем к двадцати.

amyatishkin: Однако, пока книга находится в сети, удобнее искать текст, если там идут куски небольшого объема.

Hoax: Дело в том, что конвертация файлов из БД будет производиться в момент получения файла пользоввателем, т.е. "на лету". Поэтому всё равно, будет отгружаться файл в rar, chm и т.д. -- из начально он распилен на главы и находится в базе в виде форматированного html. В принципе, возможен вариант с обратной конвертацией этого добра в rtf, с назначением стилей. Пока править текст логичнее непосредственно в базе. Насчёт массовых поиска/замен в нескольких файлах сразу -- они прекрасно осуществляются с помощью программы HomeSite, например, или UltraEdit.

vkni: А как насчёт генерации pdf через Latex? Т.е. сгенерировать .tex файл, а потом его обработать чем-то типа pdflatex? ------------------ + довольно качественное оформление по сравнению с html. В частности возможны переносы, хорошее форматирование, хорошие шрифты (cm-super) + tex очень быстро всё обрабатывает + из tex можно переводить в rtf - только для печати, для экрана бессмысленно.

vkni: Ещё мысль - позволять экспортировать html файл из милитеры в разных кодировках, с разными переводами строк. (cp866, cp1251, koi8-r, UTF8; CR, LF, CR/LF)

vkni: Вдогонку вопрос - какая внутренняя кодировка базы?

Hoax: 1-2. Это всё можно прикручивать ПОТОМ. Когда база включится. Сейчас у меня стоят задачи доделать шаблоны ввода + нужно забить в базу титулы всех книг, следовательно, нужно дописать инструкции тем, кому я разошлю на выходных письма:) а уж потом пойдёт 2-я фаза -- бесконечная оптимизация. 3. сз1251

Hoax: Разбиение по главам обязательно будет.

Энциклоп: Hoax пишет: Разбиение по главам обязательно будет. И это правильно.

xogok: Цитата: "Насчёт массовых поиска/замен в нескольких файлах сразу -- они прекрасно осуществляются с помощью программы HomeSite, например, или UltraEdit." Возможно, не спорю. Можно вспомнить и программу Search & Replace. Но я не об этом -- на фига? Можно и зайца научить курить, но каков смысл? Это всё-таки некая экзотика, возможная, но не очень удобная: у человека может не быть спец.софта, позволяющего делать замены в многих файлах, а уж текстовый редактор какой-нибудь -- всяко будет. К тому же, эти программы, что я видел, делают АВТОМАТИЧЕСКУЮ замену, а что если надо просматривать каждый встречающийся случай и принимать решение вручную? Опять придется по 20 файлов открывать и повторять процедуру 20 раз. Есть известный афоризм: автомат (в смысле, оружие) хорош не когда к нему уже ничего нельзя добавить, а когда из него ничего уже нельзя убрать.

xogok: Цитата: Разбиение по главам обязательно будет. Какова будет внутренняя структура данных в базе -- в принципе, мне неважно, да меня это и не касается. Хочется чтобы пользователь, скачивающий книгу, мог получить её в виде одного html-файла c картинками -- аккурат как сделано на www.fictionbook.ru Тамошнюю систему я считаю близкой к идеалу. Единственное -- там не хватает грамотного оформления текста (номеров страниц, грамотных примечаний), но это -- дело наживное.

vkni: >3. сз1251 хз1251 :-). А как дела будут обстоять с умляутами? Может всё-таки лучше UTF-8? Правда размер будет в 2 раза больше. :-( >Это всё можно прикручивать ПОТОМ. Само собой потом. Тут вроде спрашивалось, что вообще хочется, да? Я и не стеснялся поэтому :-).

Hoax: Единственное -- там не хватает грамотного оформления текста (номеров страниц, грамотных примечаний), но это -- дело наживное. Для меня это намного важнее того, будут картинки располагаться в тексте, либо в отдельном файле. Про отдельный файл я уже написал, что такая функция будет. Чтобы "картинки" (тамбнейлы) были в тексте книги, нужно будет проставлять вручную эти картинки перед тем, как текст загнать в БД. Если такие герои отыщутся -- велкам. Я не против.

Hoax: С умляутами всё будет как сейчас на Милитере. А сейчас с умляутами на Милитере нет проблем. Вообще -- пусть пользователь себе настраивает кодировку. В базе будет одна, виндовая -- это ныне стандарт в русской сети. Насчёт ПОТОМ :) Я не против потом наворотить чего угодно, это даже приятно. Любые кодировки, форматы, целиком файлы, по кускам, wet pussy, hot pussy, smelly pussy и т.д. Но сейчас меня так достал процесс доводки базы (Милитера ведь побочный продукт, а база делается, скажем так, несколько для другого), что я хочу быстрее закончить переход. Важное там -- классификаторы и возможность выводить книги по войнам, по родам войск, по авторам, по ключевым словам и т.д. А ещё важнее, наконец, начать формировать нормальную базу первоисточников, документов. И меня, вобщем-то, интересуют концептуальные замечания и предложения. Например -- чего не хватает из разделов, или лишние, напротив. Никто не говорит о том, что нужно сделать раздел карт и схем. Или раздел книг в djvu. Или раздел фотографий. Или ещё какую-нибудь хрень. У меня, конечно, есть всякие задумки и придумки, от которых мир содрогнётся, но хотелось бы и вокс попули послушать, может чего умное услышу.

Hoax: К тому же, эти программы, что я видел, делают АВТОМАТИЧЕСКУЮ замену, а что если надо просматривать каждый встречающийся случай и принимать решение вручную? Опять придется по 20 файлов открывать и повторять процедуру 20 раз. Я так понимаю, речь идёт о программке AfterScan?

AlexMH: Очень хотелось бы иметь возможность скачивать книги целиком в rtf или txt формате, и без рисунков. Читаю обычно на наладоннике, естественно, оффлайн. Так, чтобы скачал - и читай, и без всяких конвертеров.



полная версия страницы