Форум » Милитера (militera.lib.ru) » Ошибки в текстах » Ответить

Ошибки в текстах

McShley: Исходим из того, что Милитера суть библиотека. Отсюда, казалось бы, следует, что идеал состоит в точном соответствии электронных текстов их бумажным оригиналам. В этом смысле ошибки OCR подлежат безусловному искоренению - это без вопросов. Если хозяин и повелитель сайта так заботится о возможности использовать тексты для цитирования, что требует возиться с номерами страниц - хотя это сильно прибавляет трудоемкости, - то менять текст нельзя. А если не менять нельзя? В наш халтурный (заработать, а не дело сделать) век книги изобилуют грамматическими и орфографическими ошибками, опечатками, очепатками и даже отчепятками. Безграмотности в интернете и так хватает. По моему глубокому убеждению, бороться с незнанием родного языка можно единственным способом: на глаза читателю должны попадаться только правильные, как диктант на пятерку, тексты. И вот вопрос - что делать? Мне кажется, это вопрос политики, и, пообсуждав его, если нужно, на Форуме, нужно придти к некоторому решению - здесь последнее слово, безусловно, за Хоаксером - сделать его правилом, обязательным для правщиков. Только это правило не должно содержать никаких оценок и сравнительных степеней, вроде «грубые ошибки и явные опечатки править, а негрубые и неявные - оставлять». По поводу ошибок второго рода (по классификации сегодняшнего поста Хоаксера) - осмелюсь предложить такой прием: в файл с соответствующим текстом помещать на правах отдельной главки разного рода дополнения, уточнения и замечания, возникщие у обработчика текста, а может быть, и позже, у читателей, после размещения текста на сайте. Мне кажется, это будет корректно по отношению к автору, на, боюсь, прибавит работы содержателям сайта. Отмечу только, что деление на фактические ошибки и опечатки достаточно условно. Так, в примере, приведенном Хоаксером: в книге «Инженерные войска в боях за Советскую Родину» фраза «7-я понтонно-мостовая бригада и 1-й понтонно-мостовой полк — присвоением наименования Люблинских...» не соответствует действительности, т.к. наименование им было присвоено Лодзинских, а не Люблинских, чему есть документальное подтверждение. - речь идет на самом деле, скорее всего, об ошибке какой-нибудь машинистки или наборщицы, для которых слово Люблинский - привычно, а слово Лодзинский - нужно еще разглядеть. Кстати, ту же ошибку мог сделать и сам автор, пробегая глазами источники, вместо того чтобы читать Плюс экономия на корректорах (купили спеллер, что вам еще нужно?).

Ответов - 37

amyatishkin: Зачем же отдельный файл? Ставите ссылку на комментарий и даете правильную версию. Или, если в двух словах можно - сразу в скобках.

Hoaxer: 1. Я не считаю наш век халтурным, и вообще как-то отличающимся в принципе от других веков. Достаточно почитать Гесиода с Екклезиастом, чтобы понять -- всё одно и то же. Поэтому часто встречающиеся сетования на тему «в наше нелёгкое время» или «эхе-хе, времена такие» -- считаю типичным конформизмом сетующего, который заранее подстелил себе соломку на тот случай, если придётся упасть в грязь лицом -- дескать, не виноват я, это век-волкодав такой у нас, набросилси-и... Это было общее рассуждение, не относящееся ни к кому на этом форуме конкретно. 2. Пагинация страниц очень важна, поэтому ей уделяется такое внимание. Она гораздо важнее, чем исправление ошибок первого рода -- потому что цифровой «образ» печатной книги конкретного издания должен делиться на страницы так же, как и оригинал. А опечатки-ошибки в данном случае не влияют на дальнейшее использование текста -- при цитировании их можно исправить, а вот номера страниц восстановить не получится. У любой электронной библиотекой есть постоянный выбор -- выложить книгу с ошибками, доведя её до определённой приемлемой степени готовности, либо держать её до тех пор, пока они не будут все вычищены. Второе -- сугубый формализм, который требует таких же затрат, каких требует корректура при издании печатной книги, чего себе не могут позволить многие эл. библиотеки (всё-таки это, в основное, проекты энтузиастов). Когда я спрашивал читателей, что им больше по душе -- когда в месяц появляется 10 книг, вычищенных от и до, либо 30, с опечатками, все выбирали второе. Вот он, вокс попули, и не будем идти против шерсти. 3. Согласен, что если в тексте встречаются ошибки второго рода, т.е. фактические, исправлять их в тексте (заменять) не надо, а надо давать в виде комментария. Будем это делать так: надо придумать особый знак, например {=1} или ещё как, чтобы больше он ни к каким примечаниям не был привязан, выделять его особым цветом, и помещать в том же файле (app.html), что и обычные примечания. В данном случае от слова Люблинские , будет идти подобная ссылка на пояснение -- в чём ошибка, чем обоснована поправка и кто её сделал.

amyatishkin: Олег! Ну что ж такое - ошибки вижу только после опубликования на сайте. Наверно это сила печатного слова. Эрр Ф.-Ж. Артиллерия в прошлом, настоящем и будущем Аннотация издательства: В настоящем труде французский ген. Эрр на основе опыта империалистической войны 1914–1918 гг. подвергает критическому рассмотрению все основные вопросы, касающиеся как техники, так равно тактики и организации артиллерии. Очертив происшедшую за время указанной войны эволюцию взглядов на использование артиллерии и попутно отметив вызванные этой эволюцией изменения в области материальной части и организации, автор выясняет, какова должна быть для будущей войны наилучшая система материальной части, а также организация артиллерии, и что было сделано в этом отношении после войны в главнейших армиях мира. Меркац Ф. Германское войсковое руководство по пулеметному делу Аннотация издательства: Из предисловия: Каждому строевому т.е. дубель Боевой устав пехоты Красной Армии (1942). Часть 2 (батальон, полк) Правка моя, а ОКР не знаю чей - вы присылали когда-то файл


S.N.Morozoff: amyatishkin пишет: цитатаНу что ж такое - ошибки вижу только после опубликования на сайте. Наверно это сила печатного слова. Между прочим, неоспоримый факт. Со мной то же самое.

S.N.Morozoff: Это отражение монитора. А может - признак истинного арийца. :)

tancist: S.N.Morozoff пишет: цитатапризнак истинного арийца Бр-р. Нехорошо звучит как-то... Тогда давайте придеремся к курчавым вьющимся волосам - а что, похожи на еврейские....

"Иванов": юдей = людей (букву пропустил)

S.N.Morozoff: tancist, "Иванов" Хороший аватар, правда?! :) Вот ведь покою не дает! "Иванов" Зачем, спрашивается, посты удалять? Теперь про отражение в мониторе - вообще в воздухе висит! Нехорошо-с! Сами же начали...

"Иванов": Голубые глаза аватара - это линзы?

"Иванов": при хорошем увеличении виден второй уровень тетриса. Или даже третий...

"Иванов": S.N.Morozoff пишет: цитатаВот ведь покою не дает! так если зеленым крипичом по голове - какой тут покой!

S.N.Morozoff: "Иванов" пишет: цитататак если зеленым крипичом по голове - какой тут покой! "Кирпичи - не кирпичи без пары-тройки бутылок!" :)

"Иванов": Красная звездочка! и больше я вам, буржуинам, ничего не скажу!

S.N.Morozoff: Это не звездочка - это знак качества на зеленом кирпиче. Что Вы хотите от WEB сжатия? Да и вообще - ребенок рисовал! Нет, определенно, аватар был выбран правильный. :)

S.N.Morozoff: :)

tancist: S.N.Morozoff пишет: цитата6 "А" класс - ребенок рисовал Да я уже в 8 лет модельки клеил, а тут...

Максим: tancist пишет: цитатаДа я уже в 8 лет модельки клеил И за сколько из тех, восьмилетних, Вам теперь не стыдно? То-то же (произносится отеческим тоном).

tancist: Максим пишет: цитатаИ за сколько из тех, восьмилетних, Вам теперь не стыдно Это уже другой вопрос.... :)

McShley: "Иванов" пишет: цитататак если зеленым крипичом по голове и в другом месте: цитата Это не звездочка - это знак качества на зеленом кирпиче Нужна ли лучше иллюстрация проблеме интерпретации? И отрицания очевидного факта (звездочка-то она звездочка, с пятью лучами, нечего за WEB прятаться).

"Иванов": если набрать в окне поиска имена людей Liz Driscall, Simon Greenall, Яндекс дает подсказку: translit? возможно, имелось в виду: «Лиц Дрыщалл, Симон Грееналл»

nikola_ufa: Попов А.Ю. "Диверсанты Сталина". в биографической справке по Рабцевичу А.М. указано что умер он в 1961 г., а вышел на пенсию в 1963. Разведчик, конечно, но не до такой же степени!

amyatishkin: А это так в тексте было. Вот.

nikola_ufa: Значит дядя точно шпион!

tancist: nikola_ufa пишет: цитатадядя точно шпион Мож я не прав, но Шпиён - это ИХ, а у НАС - разведчик!

nikola_ufa: Это да, это так.

McShley: В оглавлении осталась ошибка OCR "последнею наступления" вместо "послегнего"

2GvShAD_Romeo: Кстати, меня удивляет регулярный глюк распознавания (как мне кажется) - очень часто буква "о" в конце названий населенных пунктов превращается в "е": Сталине вместо Сталино, Волкове вместо Волково и т.п. Это касается не только Милитеры но и всего lib.ru. Интересно где глюк базируется?

amyatishkin: 2GvShAD_Romeo Программа воспринимает слово как соответствующую фамилию. Вылавливать это сложно.

McShley: То есть виновата не распознавалка, а проверялка? А если попробовать ее отключить?

amyatishkin: Там сложнее становиться проверять. Т.е. если стоит "показывать максимум ошибок", то такое название (если в базе есть похожая фамилия) первый раз на странице подсвечивается на ошибке. А остальные разы может без подсветки идти. А если уменьшать уровень выявления ошибок - их будет в разы меньше показываться. Т.е. проверка сведется к фикции.

amyatishkin: Кстати, то же самое имеет место при распознании иностранных фамилий, похожих на имена - Робертс похоже на Роберт и распознается как Роберте.

S.N.Morozoff: Вот интересно. На 5-м ридере и на газетном тексте Сталино - Сталине и тому подобные ошибки - далеко не норма. Как правило распознается верно. Характерные ошибки другие - "п" и "н", например, уже упомянутые "ею" и "его". То есть чистые ошибки распознавания букв из-за некачественной печати.

Клон: 6 FReader: текст дрянной, но стабильно распознается "прочность" как "дрочность".

Vitaliy: Частенько еще "с" в конце слова читается как "е", особенно в буржуазных словах. Массово "Таймс" становится "Тайме". В книге Дэвидсона о Вьетнамской войне генерал Абрамс становится порой "Абраме" (таки-да? ), а Дин Раск - "Раек".

S.N.Morozoff: Vitaliy пишет: цитатаМассово "Таймс" становится "Тайме". С "Таймсом" - точно. А аббревиатуру ВКП(б) Ридер еще ни разу на моей памяти не распознал правильно, во всяком случае в газетном тексте.

amyatishkin: Это проблема большинства английских фамилий, которые состоят из имени+"с" на конце. (Фактически ситуация та же, что и у пар Иванов-Иваново). Но, теоретически, должна полегче решаться. Я вот никак собраться токо не могу: Сканится из словаря англо-русского для школьников раздел с именами, распознается, добавляем "с" и вводим в Файнридерский словарь.

McShley: В предисловии к "Ледоколу": Страшно было умереть, не написал этой книги Нужно "не написав".



полная версия страницы