Электронная книга для чтения pdf


Читаем DJVU и PDF на шестидюймовом ридере с комфортом / Geektimes

Бытует мнение, что на электронных книгах с e-ink дисплеями, можно комфортно читать только текстовые книжки, где можно выставить большой шрифт, а вот pdf и тем более сканы в djvu читать практически невозможно, глаза сломаешь разбирать мелкие буквы на небольшом дисплее. Спешу вас разуверить, читать такие книги вполне можно комфортно.

Это у меня уже вторая электронная книга и прочитано на ней уже довольна много книг, объемных, большая часть из которых и составляет техническая литература, которую в fb2 формате не найдешь. С книгой которую я купил первой, шла замечательная утилита JaP (Just Another Printer), которая умела нарезать pdf и djvu на куски, для четных и не четных страниц можно было выставить свою рамку, так же можно было добавить контраста, и все это дело она сохраняло в формат моей книги wolf. Для хорошего качества книг, допустим купленных или качественно сосканированных этого вполне было достаточно, но сканы плохого качества, а таких было не мало, страницы прыгали на листе, поля разнились, так что приходилось чуть ли не для каждой страницы выставлять рамку отдельно.

Такое положение вещей мне быстро надоело и я написал скрипт, который режет станицу пополам и обрезает поля, это сильно упростило подготовку книг для чтения. Но в разных книгах был разный шрифт и формат страниц и если некоторые вполне было так комфортно читать, то бывали попадались книги большого формата и не сильно крупным шрифтом, их чтение уже было не столь комфортным. Тогда то и родилась идея порезать не на две части, а на три, ради эксперимента, и результат оказался вполне отличным. Визуально буквы стали крупнее из-за того что вытянулись в длину. И хотя казалось бы, что оставшись в ширину такими-же, это будет выглядеть не очень то. Но чтение, довольно подсознательный процесс, даже смотря на очень мелкий текст я не всматриваюсь в буквы, я мельком взглянул и понимаю его смысл уже, распознавание происходит автоматом. Причем если читаем книгу, а не отдельную фразу, то мы в контексте книги и подсознание уже примерно знает какую информацию и какие слова тут можно встретить, что то же улучшает процесс распознавания. Я читаю мелкий шрифт так же быстро как и крупный, если его конечно вообще хорошо видно, но психологически комфортнее читать текст с привычным для обычных книг текстом шрифта, поэтому такой хак проходит на ура, подсознание и так вполне способно распознать текст, но с крупными буквами мне теперь читать его комфортнее.

Внизу приведен сам код скрипта, он довольна прост и без излишеств, так как писался в основном для себя. Самые главные строчки в нем это обрезание полей, разрезание страницы на три части с помощью ImageMagic и увеличение резкости, т.к. после уменьшения размера картинки резкость теряется, еще можно для запущенных вариантов поиграть с контрастом. Работу скрипта проверял на Ubuntu 10.04, для работы должны быть установлены ImageMagic, libtiff, pdftk и DjvuLibre. Как показала практика, djvu несколько тяжеловат для моего ридера, а вот pdf встроенный xPdf читает просто на ура, скорость перелистывания в pdf-файлах размером более 300Мб на уровне того же fb2. Да кстати о размере, файлы получаются огромными от 100Мб и до 300 и больше даже, в принципе при сегодняшней цене на флешь память это не так критично. Пробовал уменьшать DPI но при 16 градациях это заметно становится, поэтому оставил как есть, может кто подскажет как уменьшить размер без заметных потерь в качестве, буду благодарен.

#!/bin/bash # скрипт для преобразования PDF и DJVU файлов в формат для эклектронной книги 800x600 # использование: скрипт документ -in_[pdf|djvu] -out_[pdf|djvu] -img_format_[png|jpg] in_format=$2 out_format=$3 img_format=$4 if [ "$img_format" = "-img_format_png" ]; then img_format=png else img_format=jpg fi mask="*.*" if [ "$in_format" = "-in_djvu" ]; then # если это DJVU то приобразовываем его в многостраничный TIFF ddjvu -format=tiff $1 1.tiff # режем получившийся TIFF в по страницам tiffsplit 1.tiff rm 1.tiff mask="x*.tif" else # режем PDF по страницам pdftk $1 burst mask="pg_*.pdf" fi pages="" # обработать все страницы for p in `ls -1 $mask`; do # конвертируем страничку в JPG и преобразуем в оттенки серого if [ "$in_format" = "-in_djvu" ]; then convert -colorspace gray -normalize -contrast $p $p.${img_format} else convert -density 300 -colorspace gray -normalize -contrast $p $p.${img_format} fi rm $p p=${p}.${img_format} # обрезаем все поля автоматически convert -trim +repage $p $p # вырезаем верхнюю часть картинки convert -gravity North -crop 100%x35% +repage $p 1_$p # вырезаем вторую часть картинки convert -gravity Center -crop 100%x35% +repage $p 2_$p # вырезаем третью часть картинки convert -gravity South -crop 100%x35% +repage $p 3_$p rm $p # меняем разрешение на 800х600 convert -scale 800x600! 1_$p 1_$p convert -scale 800x600! 2_$p 2_$p convert -scale 800x600! 3_$p 3_$p # разворачиваем на 90 градусов convert -rotate 90 1_$p 1_$p convert -rotate 90 2_$p 2_$p convert -rotate 90 3_$p 3_$p # улучшаем качество картинки convert -sharpen 0.01 1_$p 1_$p convert -sharpen 0.01 2_$p 2_$p convert -sharpen 0.01 3_$p 3_$p # если выходной файл DJVU if [ "$out_format" = "-out_djvu" ]; then # конвертируем странички в djvu-формат c44 -dpi 150 1_$p 1_$p.djvu c44 -dpi 150 2_$p 2_$p.djvu c44 -dpi 150 3_$p 3_$p.djvu # список страничек pages=${pages}' 1_'${p}'.djvu 2_'${p}'.djvu 3_'${p}'.djvu' else convert -define pdf:use-trimbox=true -density 200 1_$p 1_$p.pdf convert -define pdf:use-trimbox=true -density 200 2_$p 2_$p.pdf convert -define pdf:use-trimbox=true -density 200 3_$p 3_$p.pdf # список страничек pages=${pages}' 1_'${p}'.pdf 2_'${p}'.pdf 3_'${p}'.pdf' fi rm 1_$p 2_$p 3_$p done # создаем выходной файл книжки if [ "$out_format" = "-out_djvu" ]; then # собрать в единый DjVu djvm -c out.djvu $pages else # собрать в единый PDF pdftk $pages cat output out.pdf fi rm $pages

Собственно получившийся результат, на качество картинок не обращайте внимания, фотал на мыльницу, без вспышки, что бы исключить блики. Книга порезанная пополам, без полей:

Книга со страницами порезанными на три части:

А вот для примера и книга со страницами порезанными на четыре части, по мне так уже немного перебор:

UPD: Пользователем alakond был предложен способ как несколько снизить размер выходного файла, для этого использовать PNG формат в качестве промежуточного формата изображений вместо Jpeg, в скрипт добавлены его изменения для выбора промежуточного формата.

geektimes.ru

PocketBook 903 Pro — личные впечатления от чтения PDF и DJVU

По жизни у меня есть необходимость читать научные PDF и DJVU. Естественно, на маленьком экране делать это очень неудобно, а лишний раз расходовать бумагу (то бишь лес) мне не позволяет совесть, да и носить распечатки неудобно.

Поэтому всю осень я ждал появления 903 модели и мысленно разрывался между Amazon Kindle DX и PocketBook 903 Pro. Каждый день заходил на сайт. Но хорошие новости запаздывали.

В PocketBook меня привлекал развитый (относительно других производителей) софт, а в Kindle DX — экран Pearl и пока ещё бесплатный 3G.

Потом появились другие дела и я плюнул на ежедневный заход на сайт PocketBook. И вот, некоторое время назад в Озоне появилась в продаже 903 модель.

Я предпочёл купить именно её, прочитав отзывы, что софт для просмотра PDF у Kindle DX находится в зачаточном состоянии. А ведь даже на 9.7-ти дюймовый экран в пропорции 1:1 не влезет PDF формата А4, поэтому чаша весов склонилась к PocketBook.

Кроме того, мне нравится покупать устройства оснащённые всем, что только может пригодиться в жизни. К плюсам модели от PocketBook можно также отнести MicroSD с поддержкой карт до 32 GB (я книголюб) и Bluetooth.

Итак:

Устройство красиво упаковано — в стильный картонный чемоданчик.

Порадовало, что поставляется вместе с красивым бархатным чехлом. Правда, задняя стенка у чехла чуть более твёрдая, чем передняя, под которой стекло (что нелогично). Я засовываю девайс экраном к более твёрдой стенке.

Если бы в чехле была металлическая или пластиковая вставка над экраном, меня бы это больше устроило.

Когда по дороге домой я впервые включил устройство в метро, мне показалось, что экран подсвечивается. Контраст, видимо, выше чем у старых e-ink устройств. Но потом глаза привыкли и это перестало радовать. А поскольку я читаю и обычные книги, то сравнение не в пользу девайса. Сканы и фотки будут ниже.

Зарядка в комплекте не предусмотрена — только USB-кабель. Это мелкий минус. Как правило, от компьютера все устройства заряжаются дольше, т.к. ток по USB ограничен.

Вот какие кнопки есть:

Аппаратная начинка, к сожалению, такая же как и у обычных моделей PocketBook: проц 533 Mhz, RAM 256. Я бы добавил памяти, увеличил скорость процессора и поставил аккумулятор в 2 раза больше. Всё-таки речь идёт о самой топовой читалке в линейке.

Со снятой задней крышкой. Видна симка 3G.

C 3G мне не повезло — ограниченная партия с 3G от Мегафона, видимо, быстро закончилась (анонсировался доступ только к BookLand), поэтому я купил симку «Интернет Старт» (без абонентской платы, 1.20 руб/мб) и попробовал её. Подсказать, как самому подключить 3G, мне смогли только по телефону в службе поддержки PocketBook: оказывается, нужно просто указать в параметре «Точка доступа» — «internet».

Для ясности: у меня прошивка 2.0.5.

Браузер работает очень медленно, часто не понимает javascript, пользоваться им тяжело. Например, я не нашёл возможность прокрутить всю страницу одним нажатием кнопки (аналог PageDown). За 40 минут серфинга батарея разрядилась на 3 деления. Так что эта возможность для самых крайних случаев и эпизодических задач типа просмотра почты или новостей.

Стилус — это круто! Его чувствительность, правда, оставляет желать лучшего, т.к. он индукционный. Но стилус удобен тем, что вместо нескольких нажатий кнопок можно обойтись всего одним. Если же курсор уже стоит на нужной позиции, то лучше воспользоваться кнопками — так надёжнее.

Вообще, всё продумано так, что можно обойтись и без стилуса. Просто с ним быстрее.

Есть экранная клавиатура — для ввода текста. Правда, она не очень похожа на PC. На скане — экранная клавиатура и активное содержание с заметками. Заметки сделаны хорошо: их можно делать как текст или картинки (если смотрим DJVU например). Картинки можно даже изменять в простом графическом редакторе, а текст — править. Единственный минус: многострочные заметки при редактировании располагаются в одну строку.

TTS — прекрасно читает на русском. Видимо в синтезаторе записаны самые частоиспользуемые слова. В общем можно детям сказки ставить, если вы не боитесь, что потом они будут говорить немного по роботически с иногда проявляющимся украинским акцентом :-) Качество произношения на других языках оценить не могу.

Теперь о главном. Впервые я стал получать эстетическое удовольствие от чтения электронных книг и журналов — ведь всё оформление сохраняется. Это приятно при чтении художественной литературы и просто необходимо для изучения научной.

Чтение PDF

Работает почти идеально. Для того, чтобы было лучше понятно, каково качество экрана и как отображаются PDF-файлы я отсканировал экран устройства. Конечно, есть определённые искажения по сравнению со сканированием обычной книги (экран физически не может быть прислонён к сканеру из-за бортиков как сканера, так и самого ридера, расстояние — 4.5 мм). В реальности экран ридера выглядит несколько более контрасным и чётким. Сканировал я с разрешением 600 dpi.

Для начала я попробовал вывести страницу A4 на экран. 2 примера: научный текст и научно-популярный журнал:

Читать можно, но мелковато.

Мы можем развернуть экран.

А ещё лучше включить режим чтения колонки

Есть reflow режим. Но работает он плохо. Тормозит по минуте и более на страницу. Самое быстрое отображение одной страницы в reflow-режиме заняло 20 секунд. Самое медленное — бесконечность: ридер зависает.

Но при таком экране этот режим редко нужен — он только портит оформление. Буду надеяться, что в следующей прошивке исправят.

По поводу интерфейса. В целом всё довольно хорошо продумано. Вместе с тем у разработчиков есть какая-то зацикленность на том, чтобы непременно после каждого нажатия происходила частичная перерисовка экрана. Я могу нажимать кнопки и тыкать стилусом намного чаще, чем перерисовывается экран. Если бы они сделали обновление экрана раз в секунду (при наличии изменений в видеопамяти) и каждый раз показывали актуальное состояние, было бы гораздо лучше.

Теперь сравним PDF на экране и на бумаге (снимал фотоаппаратом Casio EX-P700 в режиме макросъёмки)

Жаль, что нельзя ненамного сдвинуть изображение в сторону — только на всю видимую область. Однако при таком большом экране это терпимый недостаток — всё и так влезает.

ЧТЕНИЕ DJVU

Я сделал сравнительные фотографии страницы из книги и экрана устройства. Тут нужно учесть, что DJVU — это формат с потерями, не говоря уже о том что по сути мы будем видеть двойное сканирование со всеми присущими искажениями.

При дневном свете

Фотовспышка

Сканер

Масштабирование в PDF и DJVU

Довольно много вариантов.

Фото при неярком дневном свете, миниатюра с цветокоррекцией

Самые полезные режимы — это масштабирование по колонкам. Вы можете читать книги без перематывания вверх и вниз — софт это сделает за вас.

К сожалению нет возможности выделить стилусом область для масштабирования.

Словари

Полезная возможность. Их предустановлено несколько десятков, правда, большинство из них — триальные, о чём можно узнать после окончания первой недели эксплуатации. Есть возможность закачать и свои словари или конвертировать их из других форматов.

Сканер

Работают также в PDF (если есть текстовый слой), но глючат.

ВЫВОДЫ+ БОЛЬШОЙ ЭКРАН. Удобное чтение PDF и DJVU+ поддержка многочисленных форматов+ функциональный софт ( словари, заметки, закладки, граф. редактор, браузер, экранная клавиатура)+ стилус+ чехол в комплекте+ русскоговорящая телефонная служба поддержки

— ЦЕНА— говорят что экраны PEARL лучше— стандартные аппаратные характеристики и аккумулятор— отсутствие симки 3G— есть глюки в прошивке— частичная перерисовка экрана после каждого нажатия

КРАТКИЙ ВЫВОДПо моему субъективному мнению, устройство стоит своих денег. Чтение PDF и DJVU — оценка 5-

Понравилась статья? Подпишись на новости! (Еженедельный новостной дайджест)

Еще статьи по теме

ibook-reader.ru

Сравнение чтения PDF/DJVU файлов на электронных книгах PocketBook 301 Plus и Азбука n516 / Geektimes

Чуть ли не каждый второй вопрос, который я получаю от клиентов в нашем небольшом магазине, звучит приблизительно так: "А как у этих читалок с поддержкой PDF?". Долго и много разъясняя, я наконец решил систематизировать свой опыт в этом посте и поделиться им с пользователями Хабра. Поскольку две самые популярные модели у нас: Азбука n516 и PocketBook 301,- сегодня о них и пойдет разговор.

Итак, под катом вы найдете сравнительный обзор чтения этими устройствами следующих форматов:

  • обычных PDF файлов;
  • отсканированных PDF файлов по 1 странице на одном листе А4;
  • отсканированных PDF файлов по 2 страницы на одном листе А4;
  • отсканированных DJVU файлов с изображениями схем.
Каждый вариант будет представлен в двух ориентациях страницы: альбомной и книжной, и снабжен большими(!) фотографиями. Начнем со сведений о версии прошивки. В PocketBook 301 — это прошивка версии 301.12.7. В Азбука n516 — прошивка OpenInkPot 0.3 rc1. А вот сравнительное фото наших героев. Извините, за желтый цвет, штатив коротковат и пришлось держать в руках. Дальше будут фото в более естественных цветах. :)

Как видим при первом же рассмотрении, шестидюймовый PocketBook сразу дает фору пятидюймовой Азбуке. Однако, провести детальное сравнение их возможностей нам кажется вполне уместным, учитывая «безрыбье» ридеров, читающих PDF, и значительную разницу в цене этих устройств.

Какой у нас есть выбор режимов масштабирования текста в PDF? Методом проб и ошибок в Азбуке были найдены следующие режимы, которые хоть сколько-нибудь влияют на отображение текста:

  • Fit Text Width — похоже, режим по умолчанию для всех PDF файлов;
  • Fit Width — тоже, что Text Width + поля страницы;
  • Fit Height — страница целиком по высоте;
  • Best Fit — загадочный режим, ведет себя в разных ситуация по-разному. Мне не удалось понять суть работы;
  • Stretch Fit — аналогично предыдущему;
  • No Fit — показывает страницу «как есть» без масштабирования.

Кстати, нажатие на специальную кнопку «увеличить» на корпусе Азбуки, абсолютно ничего не дает. Что бы попасть в указанный на фото раздел нужно нажать на кнопку «Menu» и потом на кнопку 4, что совершенно нельзя назвать интуитивно понятным, как мне кажется.

Режимы в PocketBook 301:

  • многостраничный просмотр — отображает сразу несколько страниц на экране. Я не смог придумать применение этому режиму;
  • по ширине — похоже, как и в Азбуке, режим по умолчанию для всех PDF файлов;
  • обычный — аналогичен No Fit в Азбуке в значении по умолчанию, но можно уменьшать/увеличивать масштаб произвольным образом;
  • колонки — особый режим, когда страница визуально разбивается на колонки (текст при этом не переформатируется). Ниже остановлюсь на нем подробнее;
  • опция компоновки — приводит к изменению размера шрифта и переформатированию страницы.

Сразу оговорюсь, что в отличии от человеческих форматов для читалок типа FB2 ни одна из перечисленных опций, кроме опции компоновки в PocketBook, никак не меняет формат текста. Все манипуляции сводятся к изменению масштаба и режимам прокручивания отображаемого текста перед глазами читателя. Чтобы не захламлять статью фотографиями, описание режимов совершенно непригодных для чтения я буду опускать. Прошу прощения, если вам покажется, что фотографий все же слишком много, хотелось все-таки дать исчерпывающий ответ на столь наболевший вопрос от аудитории.

Начнем с обычного PDF (Это тот, где текст распознан и его можно копипастить)
Книжная ориентация у Азбуки с режимом по умолчанию Fit Text Width.

Как видим все достаточно мелко. Читать можно, но не долго и с большим напряжением для глаз. Что бы было понятно: расстояние до объектива камеры около 10 см и даже ее было сложно сфокусировать. Любые другие режимы совершенно ничего не дают. Текст становится едва заметным.

Смотрим PocketBook 301. По умолчанию включен режим по ширине текста.

Почти тоже самое, что и у Азбуки, но чувствуется лишний дюйм форы. Поскольку это обычный PDF файл мы можем поэкспериментировать с опцией компоновки на PocketBook. Это единственная опция меняющая форматирование в PDF документе.

Шрифт увеличился, но читабельность не улучшилась. Возможно для других документов PDF с иным форматированием этот режим будет работать лучше, но в моем эксперименте он оказался бесполезен. Любые другие режимы только ухудшают чтение.

Повернем PDF в альбомную ориентацию и посмотрим на Азбуку.

Это снова режим по умолчанию Fit Text Width. Как видно читабельность текста немного улучшилась за счет того, что теперь страница просматривается в несколько приемов. Текста на странице стало меньше, но он крупнее. Для сравнения покажу второй по читабельности режим Азбуки No Fit.

Теперь видны поля и больше текста, но он очень мелкий. Читать очень трудно. А вот и Best Fit. Почему Best — это загадка. Читать можно только под микроскопом.

Перейдем к PocketBook. Снова альбомная ориентация, режим по ширине текста.

Можно читать довольно неплохо. Теперь для сравнения вернем масштаб в исходное положение.

Появились поля, текст уменьшился, но все же более читабельный, чем в Азбуке в аналогичном режиме. Хотя, конечно, по сравнению с возможностями того же FB2, неудовлетворительно. Даже в режиме по ширине текста хочется еще увеличить текст, но что бы он при этом продолжал умещаться на экране. К сожалению, с PDF это трудно. В PocketBook 301 есть опция компоновки, но как вы уже заметили выше и с ней не все так радужно. Проверим как она выглядит при альбомной ориентации документа.

Мало что изменилось. Думаю над этой опцией программистам PocketBook предстоит еще хорошенько поработать. Что касается скорости работы, то она практически одинаковая у обоих устройств. Книга открывается и перелистывается достаточно быстро. Перейдем к другому виду PDF документов, по понятным причинам, особенно распространенному на наших просторах.

Отсканированный PDF документ
Вся страница теперь представляет собой графическое изображение. Снова книжная ориентация. Первой идет Азбука. 5 мегабайтный файл открыла довольно быстро и вот, что показала.

Субъективно, картинка выглядит даже чуть лучше, чем было с аналогичным режимом в обычном PDF. Возможно это связанно просто с особенностями форматирования текста. А вот перелистывание страницы замедлилось, но все еще терпимо. Другие режимы, кроме Fit Text Width, дают одно разочарование. Во время переключения режимов ридер успел один раз повиснуть, так что пришлось перегружать.

Если Азбука открыла этот файл за несколько секунд, то PocketBook открывал его более минуты. Но работал с ним быстрее и не зависал. Вот, что получилось в режиме по ширине текста.

А вот, что в исходном масштабе.

И снова при разнообразии режимов у нас нет особого выбора. Читабельным остается только один из всех возможных. При любых попытках увеличить масштаб, текст не остается в рамках экрана, и вам приходится двигать джойстик, то в право, то влево на каждой! строчке вслед за взглядом. Учитывая общую неспешность в перерисовке страницы, такое чтения быстро начинает раздражать.

Отсканированный PDF. Поворот экрана в альбомную ориентацию. Первой снова идет Азбука.

Наконец-то более-менее приемлемое чтение. Пожалуй, самый удобный вариант для Азбуки из всех, что вы сегодня увидите. Большая часть текста скрыта, но все же перелистывать нужно не так часто, где-то три раза на страницу. No Fit по сравнению с этим выглядит очень слабо. Просто ничего не разобрать.

Перейдем к следующей читалке. Как видно, PocketBook, что в режиме по ширине текста, что в оригинальном размере, читается вполне приемлемо. Вот зачем нужны лишние 2,54 см.

Теперь рассмотрим особый случай.

Отсканированный по 2 страницы на одном листе А4 PDF.
Таким образом часто сканируют разворот книги или например ВУЗ-овские методички. Азбука не имеет корректных режимов для работы с такими документами, поэтому я не стал загружать фотографии. А вот, как это выглядит на PocketBook.

Кажется, что особо ничего не видно, но у PocketBook есть очень подходящий для этого случая режим — это отображение в две колонки.

Читабельность очень приятная и хорошая скорость просмотра. Причем, вы особо и не задумывайтесь при чтении. Страница сама перелистывается в правильном порядке, левая верхняя половина страницы, левый нижняя, правая верхняя половина страницы, правая нижняя (смотрите индикатор в левом нижнем углу на фото выше). Тут я было расстроился, что не могу свободно водить джойстиком по странице, нажатие вправо и влево ничего не дает, страница перелистывается в жесткой последовательности. Однако, совершенно случайно нашел очень классную функцию в этом режиме. Если нажать и задержать центральную кнопку на джойстике, то откроется вот такая картина, где вы видите прицел и можете свободно перемещать его по странице.

После выбора области страницы PocketBook увеличит ее и перейдет в режим чтения в две колонки. Похоже, программисты PocketBook здорово постарались для удобства пользователей и пытаются выжать все из PDF формата. Что касается скорости обновления страниц у PocketBook, то она вполне удовлетворительная. А вот файл мог бы открываться и побыстрее. А теперь перейдем к самой сложно части.

Схемы и картинки на странице формата А4.
Заодно посмотрим как ридеры справятся с DJVU. Начнем с Азбуки.

Если картинку еще как-то видно, то текст едва ли можно различить. Здесь я перебрал все возможные варианты, и Азбука снова зависла. Режим No Fit оказался единственным, при котором, текст стало возможным читать. Легче от этого правда не стало. Скорость обновления страницы стала очень и очень медленной.

Что касается PocketBook, там снова пригодился режим чтения в две колонки, но оказалось, что в DJVU зажатие клавиши на джойстике ни к чему не приводит, как это было в PDF. А значит, вы вынужденны просматривать схему последовательно сверху вниз и не можете просто сдвинуться куда вам захочется, что не удобно. Вы видите подпись на стрелке, но, чтобы посмотреть куда она указывает, делаете кучу нажатий при низкой скорости обновления. Привожу последнюю серию фотографий без комментариев.

В целом хочется сказать, что PDF и DJVU не самые удобные форматы для чтения на электронных ридерах. Они не идут ни в какое сравнение с тем же FB2, где вы можете просто выбрать подходящий для вас размер шрифта и получать удовольствие от процесса, а не заниматься перебором различных настроек. В этом свете как-то иначе смотрятся обладатели устройств, которые лишены возможности чтения PDF и DJVU. Они добровольно отказались от этой возможности и тем самым избавили себя от неизбежной «головной боли». Возможно, ожидаемое появление устройств с экраном в 9 дюймов как-то сгладит эту проблему.

Хочется дать еще пару советов. Прежде всего, когда собираетесь покупать устройства для чтения электронных книг, ни в коем случае не ориентируйтесь на аппаратное обеспечение. Электронные книги — не тот случай, где оно играет заметную роль. Хорошее ПО здесь гораздо важнее. Лучше подумайте, что вы собираетесь читать, в каком формате, рассмотрите возможные альтернативы для описанных здесь трудных случаев.

Надеюсь, что раскрыл тему и с удовольствием отвечу на вопросы в комментариях. Спрашивайте.

geektimes.ru

книжные форматы электронных книг

Электронные книги (ридеры, читалки) уже давно стали привычными устройствами для широкого круга пользователей. Их достоинства: доступность контента (скачать необходимую книгу из интернета можно за считанные минуты), не портящий зрение экран E-ink, возможность иметь в ридере коллекцию из тысяч книг, долгая работа на одной зарядке, настройки типа и размера шрифта. Не так давно появились электронные книги с подсветкой экрана - они позволяют читать в полной темноте. В общем, преимущества ридеров можно перечислять очень долго. 

Однако при знакомстве с читалками у пользователей часто возникает одна проблема. Люди, которые решают приобрести ридер в первый раз, сталкиваясь с понятием "форматы электронных книг", часто не понимают о чем идет речь. Проблема особенно актуальна для начинающих, которым аббревиатуры "FB2", "EPUB" или "MOBI" совершенно ничего не говорят. 

Так называемые форматы - это различные типы электронных текстовых файлов, которые поддерживаются (воспроизводятся) тем или иным устройством для чтения электронных книг. В электронных библиотеках интернета часто предлагается большой набор типов файлов: FB2, EPUB, MOBI, PDF, DOC, RTF, TXT и других. Выбор широк, и это ставит перед новичками определенные проблемы. Мы опишем основные форматы электронных книг, расскажем о том, чем отличаются друг от друга, какими читалками поддерживаются, и на каком формате лучше остановить свой выбор, если у вас мультиформатный ридер, читающий все форматы. 

Разновидности форматов

1. FB2 (FictionBook) - формат электронных книг, который был создан группой российских разработчиков. Книги в этом типе файлов имеют структурированный вид (то есть содержат разбивку по главам, содержание, иллюстрации, обложку). Кроме того, этот стандарт хранит информацию о файле (так называемые тэги: автор, название, жанр), которая считывается ридером и позволяет пользователю удобно сортировать файлы на устройстве. Данный типа файлов занимает небольшой объем, может быть заархивирован, а еще он хорошо конвертируется в другие форматы. Из особенностей: в виду того, что формат изначально был разработан под кириллицу, тексты на русском языке в FB2 имеют переносы слов. 

Формат был изначально рассчитан на российских пользователей, и он практически не используется за границей. Именно поэтому FB2 не поддерживается популярными мировыми производителями читалок - Amazon и Barnes & Noble. Зато это основной формат файлов для популярных в России читалок от Pocketbook, Onyx и Wexler. Кроме того, ридеры Sony теперь поддерживают FB2 - после выхода на российский рынок компания разработала официальную прошивку для ридера Sony PRS-T1, которая позволяет читать книги в FB2. 

2. EPUB (Electronic PUBlication) - самый популярный в мире электронный формат для читалок. С ним работают ридеры Barnes & Noble и Sony. По структуре верстки этот тип файла напоминает заархивированную веб-страницу, содержащую текст, графику, встроенные шрифты, иллюстрации. 

Помимо западных брендов, формат EPUB поддерживается моделями производителей, ориентированных на российских рынок (Pocketbook, Onyx, Wexler) по причине стремительного роста популярности в нашей стране. Кроме того, данный стандарт электронных книг используют iPhone и iPad. Фирменная эппловская программа для чтения iBooks поддерживает именно EPUB.  3. MOBI - формат электронных книг ридеров Amazon Kindle. Получает распространение в российских онлайн-библиотеках по мере того, как Kindle становится все более популярным в России. Другие ридеры имеют поддержку этого формата "для галочки". MOBI по своим свойствам схож с EPUB. Недавно Amazon представил еще один формат электронных текстов Kindle Format 8 или KF8 (его отличает более богатое форматирование) с уточнением, что новые и старые читалки Amazon не перестанут поддерживать MOBI. 

4. TXT - формат простых текстовых документов. Преобразовать текст из другого формата в TXT можно простейшим действием "копировать-вставить". Несмотря на то, что данный тип файла поддерживает практически всеми читалками и занимает в памяти очень мало места, читать в нем книги на ридерах мы бы не рекомендовали. В TXT отсутствует форматирование, разметка, переносы, выравнивание. Он подходит для коротких текстовых заметок, но не для полноценных электронных книг. 

5. PDF (Portable Document Format) - формат электронных документов, созданный компанией Adobe Systems. Неудобен для использования на ридерах по ряду причин. Во-первых, файлы этого форматах очень громоздкие, так как рассчитаны под мощности компьютера, и на читалках открываются достаточно медленно. Во-вторых, если файл специально не сверстан под экран 6-дюймового ридера, имеющий формат аналогичный бумажному листу размера A6, то читать на нем PDF формата A4 (а большинство PDF-файлов представлены именно в размере стандартного бумажного листа), будет очень трудно. В PDF можно увеличить только масштаб, но не размер шрифта, а значит, на экране получится разместить только какую-то часть страницы. Читать страницы придется по частям, а это очень неудобно. 

Для чтения PDF приспособлены 9-дюймовые электронные книги, размер экрана которых позволяет воспроизвести страницу в масштабе, достаточно крупном для комфортного чтения. 

6. DJVU - формат, разработанный для хранения сканированных документов - книг, статей, рукописей. Книга в DJVU фактически представляет собой набор сканированных страниц. В плане комфортности чтения на 6-дюймовых читалках - все аналогично истории с PDF. Вы не увеличите размер шрифта, а только масштаб. При зумировании страница вылезет за пределы экрана, и надо будет постоянно перемещать область увеличенного текста для чтения – о комфортном чтении говорить не приходится. Для чтения DJVU выбирайте риедры с экраном 9 дюймов. Впрочем, даже на 9-дюймовых читалках возможности удобного чтения DJVU зависят от того, насколько качественно отсканирована книга, представленная в этом формате. 

7. LRF - в прошлом фирменный формат ридеров Sony. На новых моделях Sony Reader (начиная с PRS-T1) уже не используется, так как уступил свое место EPUB. Очень плохо конвертируется в другие типы файлов. Несмотря на то, что кое-где в библиотеках еще представлен, использовать его рекомендуется исключительно владельцам старых моделей Sony. 

8. RTF (Rich Text Format) - формат для хранения текстовых документов. Относится к категории "компьютерных", а не "книжных". На ридерах читать в RTF не слишком удобно - это большие по объему файлы, и скорость работы читалки на порядок снижается. 

9. DOC (а также DOCX) - текстовые документы Microsoft Office. Эти форматы поддерживают достаточно много ридеров, но именно для чтения документов, а не книг. Файлы большого объема в этом формате могут быть велики по размеру, и работать с ними на ридерах непросто. Многостраничные книги в DOC лучше конвертировать в FB2 или EPUB. 

Основные форматы электронных книг мы перечислили. Совсем экзотические типы файлов, которые иногда встречаются в интернете, мы рассматривать не станем, а лучше определимся, в каких из вышеперечисленных форматов удобнее всего читать книги на электронных ридерах. 

Какой формат электронных книг выбрать

Если у вас читалка с поддержкой всех форматов, то остановить свой выбор на определенном типе файла, можно исходя из ряда факторов. Допустим, Вы покупаете свою первую электронную книгу, и у вас нет предварительно собранной коллекции книг, например, в FB2. В этом случае выбирайте тот формат файла, который лучше всего воспроизводится вашим ридером. Традиционные "книжные" форматы EPUB или FB2 для ридера (да и для пользователя) более предпочтительны и удобны, чем "компьютерные" PDF, TXT, DOC, DOCX и RTF. 

В случае с 9-дюймовыми читалками и необходимостью чтения DJVU и PDF при прочих равных советуем отдавать предпочтение последнему, так как PDF представляет собой более современный формат, а книги в DJVU часто бывают плохого качества. 

С точки зрения удобства использования плюсы "книжных" форматов очевидны: EPUB, FB2 или MOBI визуально лучше выглядят в меню Вашего ридера (отображаются обложки книг), их удобнее сортировать (есть тэги: автор, название, жанр), они занимают в памяти гораздо меньше места и скорость работы читалки с такими форматами будет существенно выше. 

Нужна ли поддержка всех форматов 

На наш взгляд, совсем необязательно выбирать всеформатный ридер. Многие пользователи, имеющие читалки с поддержкой всех форматов, загружают книги одном-двух типах файлов. У всех читалок (в том числе у мультиформатных), так или иначе, есть основной формат, и размениваться на другие вы в итоге не станете. Для Pocketbook, Onyx и Wexler основные форматы - это FB2 или EPUB, для Barnes & Noble (электронные книги Nook) и Sony - EPUB, для Kindle - MOBI. 

В случае с читалками Amazon и Barnes & Noble, если нужная книга оказывается в формате, который эти ридеры не поддерживают, можно воспользоваться конвертером (например, Calibre). Это программа, устанавливаемая на компьютер и позволяющая переконвертировать тот же FB2 в MOBI или EPUB за считанные минуты. 

Читать книги в родном для ридера формате лучше, чем использовать установленные на читалку дополнительные программы. Наш совет: потратьте несколько минут для того, чтобы преобразовать книгу, например, из RTF в EPUB с помощью конвертера Calibre. Это удобней, чем читать ее "в оригинале" с помощью дополнительно установленной программы (на Sony PRS-T1 или Kindle) или столкнуться с более медленной работой устройства (например, на ридерах Pocketbook). 

Помните, что главное - удобство пользования электронной книгой, а не количество форматов, заявленных у нее в параметрах. 

Приятного чтения!

Иногда кажется, что определиться с форматом дело довольно сложное, их так много и у каждого свои преимущества. Многие авторы задаются вопросом: "Как выбрать формат для электронной книги?" Мы провели свой анализ форматов и выяснили, какой же именно является лучшим форматом для обычных книг. Мы внимательно изучили множество форматов, причем рассматривали их как с точки зрения удобства читателя, так и с точки зрения удобства автора. Давайте немного погрузимся в детали и посмотрим, что повлияло на наш выбор.

Почему ePub — лучший формат?

За время разработки наших сервисов, мы изучили некоторые технические ньюансы, которые влияют на внешний вид и работу с электронной книгой.

Начнем с самого простого — управление отображением книги. Т.е. возможностью читателем менять размер шрифта и ориентацию страницы. EPUB прекрасно адаптируется к изменению размера экрана устройства или размера шрифта. Хочется отметить, что в спецификации указано, что на самом деле формат поддерживает 2 режима верстки — первый (reflowable), когда можно менять эти параметры, и второй (fixed-layout), когда можно четко указать, что где находится.

Рассмотрим режимы верстки несколько подробнее.

Разметка Reflowable

На русский язык можно перевести как текучая, адаптивная или плавающая. Позволяет подогнать содержимое книги к экрану устройства, изменять цвет и размер шрифта. Идеально подходит для обычных книг с простым текстом — романов, стихотворений, технической литературы. Т.е. всего, где не требуется четкая привязка изображений или сложное визуальное представление.

Данная разметка не подойдет для визуальных интерактивных книг и детских книг со множеством иллюстраций, то есть тех, где требуется пространственная привязка графики, разного рода комбинация картинок и врезок. Сам по себе формат EPUB позволяет создавать интерактивные книги, но адаптивный дизайн таких книг - это настоящее искусство.

Так выглядит адаптивная разметка

C поворотом экрана С увеличением масштаба

Использование этой разметки идеально в случае, когда вы точно не знаете, где и как будет вопроизведена ваша книга. Из-за гибкости разметки, книга будет корректно отображена практически на любом устройстве, начиная от компьютера и заканчивая какими-нибудь умными часами. Плюс данная разметка отлично подойдет для людей с ограниченными возможностями.

Фиксированная разметка — fixed-layout

Данный вид разметки подразумевает, что все элементы имеют четко закрепленное положение на странице с четко указанным размером. Эта разметка имеет формат, который более всего близок к физическому носителю, например странице обычной бумажной книги. Все на своих местах и никакой адаптации. На устройствах адаптация чаще всего выглядит ввиде масштабирования со всеми из этого вытекающими последствиями. То, что выглядит приемлемо на экране компьютера уже мелковато на планшете, а на экране смартфона вообще не разглядеть. Ну а игра с увеличением и уменьшением масштаба превращается в пытку читателя.

Пример отображения фиксированной разметки

С поворотом экрана С увеличением масштаба

 Этот формат подходит в том случае, когда вы точно знаете, что ваше произведение будут читать на носителе с конкретным размером, под который и будет сверстано ваше произведение. Изначально предполагается, что данная разметка разработана для дальнейшей печати произведения, поэтому в ней указываются размеры и формат будущего носителя. Мы не рекомендуем использовать данную разметку для электронных книг, так она ограничивает область чтения книг устройствами с определенным размером экрана.

Самый распространный цифровой представитель этой разметки — формат PDF, но и EPUB тоже ее поддерживает.

Мы решили свести популярные форматы в таблицу и показать поддержку различной разметки внутри них

Формат Reflowable Fixed-layout
ePub идеальная поддержка хорошая поддержка начиная с версии 3.0
PDF нет идеален для жесткой разметки
FB2 полная нет
TXT полная нет
MOBI полная хорошая

С версткой разобрались. Теперь один рассмотрим самый волнующий авторов момент — авторское право.

Поддержка защиты авторских прав на уровне форматов электронных книг

Как правило авторы настаивают на поддержке DRM (Digital Rights Management) или технических средств защиты авторских прав в электронных книгах. Это одна из самых неприятных тем, как для авторов, так и для читателей, но затрагивает и интересы издателей тоже. И основная проблема заключается в том, что нет надежного способа защиты от копирования, т.к. книга представляет собой источник преимущественно текстовой информации представленной в графической форме. Можно создать исключительно надежный способ доставки контента путем зашифрованной передачи файла в специальное отдельное приложение или даже специальное отдельное устройство для чтения книг, но это все будет обойдено простым фотоаппаратом с последующим распознаванием текста. Так что все самые сложные и неприятные для всех процедуры будет нивелированы самым примитивным способом копирования, которому уже больше двух веков. Все то, что видит глаз человека, это все увидит и камера. А дальше дело техники.

Итак, как обстоит дело с поддержкой DRM в различных форматах. Мы собрали информацию и поместили в таблицу

Формат Уровень поддержки
ePub идеальная поддержка от компаний Adobe (Adept) и Apple (FairPlay)
PDF идеальная поддержка от компании Adobe
FB2 поддержка отстутствует
TXT поддержка отстутствует
MOBI идеальная поддержка от компании Amazon на устройствах Kindle

Из таблицы видно, что ePub, PDF и Mobipocket являются форматами, отлично поддерживающими защиту авторских прав.

Однако, как мы отметили выше, ничего, кроме неудобств для пользователя DRM больше не создает. Многие были в ситуации, когда срочно нужна книга, но ее нет в формате доступном для твоего устройства. Как правило, такая ситуация частенько застает человека врасплох или в самый неподходящий момент. Обычно люди решают это разными путями, в большинстве случаев просто ищут другую книгу на эту же тему, но уже в доступном формате. Как результат, автор теряет читателей и, разумеется, деньги.

Основная проблема защиты области прав лежит в области воспитания людей и их отношения к защите авторских прав. Например, ведь никому не приходит в голову красть напрямую из магазина, хотя все лежит, только протяни руку. Аналогично и с цифровым контентом. Просто происходит осознание того, что произведение принадлежит автору и это результат его труда, который должен быть оплачен. Чем больше людей осознает это, тем меньше книг будет украдено.

Предоставление легального доступа к книгам одна из миссий нашей библиотеки.

Резюмируя вышесказанное мы снова приходим к выводу, что ePub отличный выбор и с точки защиты авторских прав.

Что не так с форматом EXE?

Наверняка многие слышали про такой формат. Этот формат называется — приложение для операционной системы Windows. Все верно, это не формат электронных книг, это обычная программа для Windows, которую нужно устанавливать и которая работает только на очень ограниченном круге устройств — компьютерах и планшетах с Windows. Открыть такую "книгу" на iPad, Kindle, Nook и планшете с Android не получится не говоря уже о других системах таких как OS X или Linux. Более того, т.к. формат является исполняемым файлом, то к нему очень часто цепляются вирусы, что делает его исключительно небезопасным. Вот так просто, скачал книгу в exe, а получил вирус. Злоумышленники часто выкладывают вирусы в духе "Все книги Донцовой.exe", но вместо книг люди получают пачку вирусов.

Существует аналогичный формат, называемый JAVA — какое-то время был популярен на старых смартфонах. Суть такая же — программа, но только для смартфона. Аналогичная маскировка вирусов для смартфонов.

Мы советуем авторам избегать издания книг в форматах EXE и JAVA, а читателям не скачивать подобные книги в целях безопасности.

О формате FictionBook

Популярен под названием FB2. Популярен преимущественно в России и на постсоветском пространстве, так что можно смело называть его национальным форматом.

 В целом формат достаточно простой, но есть и определенные неудобства связанные с тем, что он основан на формате XML. Например, чтобы отобразить название книги и автора, нужно разобрать файл целиком. Если в файле много иллюстраций, то у устройства может закончиться память и попытка чтения метаданных будет приводить к завершению работы приложения для чтения книг или просто к выдаче ошибок.

 Тем не менее данный формат содержит в себе логическую разметку, книга разбита на секции, которые могут быть стихотворениями или прозой. Однако сам по себе формат очень ограничен, т.к. не только нет поддержки сложной верстки и формул, но и банальных вещей вроде маркированных списков.

Существует идея формата FB3, усовершенствованного FB2, судя по описанию являющегося клоном формата ePub. В нем используется аналогичный zip-архив и разделение файлов на описание, текст и картинки. Дмитрий Грибов интенсивно работает над новым форматом и мы надеемся, что он порадует авторов новыми возможностями.

Данный формат хорошо подойдет для простой художественной литературы, написанной на русском языке.

О формате TXT

Представляет собой просто текст, словно вы его распечатали на обычной печатной машинке. Форматирование заключается в отступах, симуляции списков с помощью звездочек и т.п. Забудьте про картинки, цвета и формулы. Зато может быть открыт практически на любом устройстве.

О формате MOBI

Полное название Mobipocket — основной формат книг на платформе Amazon Kindle. Формат MOBI доступен с помощью программы Kindle на Mac OS X, iOS, Android, Windows и Windows Phone устройствах. Разумеется формат доступен в электронных книгах Amazon Kindle и Kindle Fire. Этот формат появился в 2000 году благодаря формату PRC, который был рожден при разработке наладонников Palm — предков современных планшетов со стилусом.

Формат MOBI имеет несколько разновидностей в виде семейства форматов AZW, отличающихся более высокой степенью сжатия данных.

  • AZW1 — другое имя для формата "топаз" (также называется .tpz). Эта разновидность предназначена для хранения отсканированных документов и похожа на DJVU. Формат TPZ — используется в сети WhisperNet. WhisperNet — это специальная сотовая 3G сеть, которая создана компанией Amazon для поддержки книг Kindle и синхронизации книг, закладок и т. д.
  • AZW3 — другое название для KF8. Этот формат впервые появился для Kindle Fire. Представляет собой скомбинированный формат ePub с базой данных Palm, DRM-защитой Amazon, практически копируя все возможности формата ePub и обеспечивая совместимость со старыми читалками Kindle.
  • AZW4 — специальный формат для учебников (аналогичен PDF).
  • AZK — это специальная версия формата MOBI под iOS для Kindle Reader и других продуктов Apple.
  • KFX — один из относительно новых форматов от Амазон, который появился одновременно с Kindle Paperwhite 3. Является наследником AZK. В него были добавлены такие возможности, как воспроизведение звуков и видео, отображение таблиц на отдельном экране, добавлен новый шрифт и формат изображений JXR.
  • AZW8 является расширением для KFX, который является еще одним специальным форматом в настоящее время на Kindle paperwhite 3, Kindle Oasis и Kindle Voyage. На текущий момент это самый продвинутый формат и используется в современных устройствах от Amazon.

О формате PDF

PDF — межплатформенный формат электронных документов, разработанный фирмой Adobe Systems.Формат доступен с помощью программы Adobe Reader на Mac OS X, iOS, Android, Windows и Windows Phone устройствах.

О формате DJVU

DJVU — формат Lizardtech, который все более широко используется для научных публикаций. Основное предназначение данного формата — хранение отсканированных изображений, содержащих текст и относительно простую графику. Его основные характеристики заключаются в том, что коэффициент сжатия примерно в 10 раз лучше, чем в формате .pdf при том же качестве. Ничто не сравнится с этим в настоящее время для черно-белого текста и изображений. Скорее всего в нем вы встретите такие журналы как Радио или Моделист-Конструктор, их старые версии практически недоступны в других форматах, потому что большинство старых журналов обычные отсканированные изображения. Для того, чтобы в нем работал поиск, добавляют специальный невидимый слой с текстом, полученный с помощью систем распознавания текста (OCR). Для электронных книг этот формат совершенно непригоден, поскольку его невозможно адаптировать для устройств с маленьким экраном, да и многие читалки его не поддерживают.

О формате DOC, DOCX

Это обычные текстовые документы, созданные в редакторе Word из Microsoft Office. Их можно редактировать, изменять шрифты и оформление. Данный формат поддерживается очень узким списком устройств и программ ввиду очень высокой сложности и закрытости формата, плюс очень часто не может быть корректно отображен. Формат подходит в качестве черновика для книги, но неприемлен для распространения.

О формате EPUB

Единственный официально признанный мировым сообществом (Международным форумом по цифровым публикациям) формат электронных книг. Поддерживает практически все, о чем только можно мечтать: сложное форматирование, списки, таблицы, формулы, сноски, растровые и векторные изображения, различные режимы верстки и DRM защиту авторских прав.

Формат поддерживают такие бесплатные программы для чтения электронных книг как iBooks, CoolReader, FBReader, Mobipocket, Okular.Устройства для чтения электронных книг в формате ePub: iPad, iPhone, Mac, Amazon Kindle, Fire, Barnes&Noble Nook, планшеты на Android и многие другие, все не перечислить.

Существует довольно много программ для создания электронных книг в вышеприведенных форматах, мы же разработали специализированное решение именно для авторов.

Редкие и устаревшие форматы

Еще мы хотели бы о рассказать о некоторых редких форматах.

  • ABW — формат файла, используемый AbiWord. Если файл сжат, то это будет формат ZABW.
  • ACSM — формат файла, используемый для обеспечения DRM защиты в Adobe eBooks PDF и ePUB.
  • AEH — формат файла, используемый eBooksWriter.
  • BBeB — собственный формат Sony. Подставки для широкополосного EBook, также известного как LRF из-за расширения файла.
  • CBR / CBZ — Сжатый контейнер для изображений. R означает, что картинки сжаты архиватором RAR, а Z означает, что сжаты через ZIP. Внутренний формат может быть любым из нескольких форматов изображений, а считыватели CBR / CBZ отображают их как несколько страниц книги. Название означает читалка для комиксов, но используется для любых книг, где содержание содержит в основном фотографии.
  • CHM — сжатый HTML, часто используемый для файлов справки Windows. Он стал очень популярным для распространения текстов и других материалов поддержки через Интернет.
  • DNL — формат цифровой веб-книги, используемый автором Desktop.
  • DTB — Digital Talking Books — книги для слепых, слабовидящих, физически неполноценных людей, учащихся с ограниченными возможностями или других читателей с отключенной печатью. DTBook устанавливает спецификации для цифровых говорящих книг (DTB) как часть DAISY.
  • EBA — фирменный формат электронных книг. Специально поддерживается eBook Readers для китайского языка.
  • EBAML же, что и EBA 2.0 — Используется на Dr. Yi Reader и других продуктах Китая.
  • -ER.PDB — формат базы данных Palm для читалки eReader. ER используется для различения этого формата.
  • FUB — формат электронной книги Франклина.
  • GPF — Ganaxa Publishing Format, позволяющий «горячие точки» и встроенный мультимедийный контент.
  • GPX — защищенный документ Ganaxa.
  • IMP — формат электронной книги, используемый eBook Technologies ETI-1 (REB 1200 / Softbook Reader) или ETI-2 (EBookwise-1150 / Gemstar 1150). Некоторые программы конвертируются в него. Он считается форматом для терминалов.
  • -IS.PDB — формат базы данных Palm для читалки ISilo. IS используется, чтобы отличить этот формат.
  • KML — формат электронной книги HieBook.
  • LIT — собственный формат Microsoft для Microsoft Reader.
  • LRC — специальный сопроводительный формат, который должен быть компаньоном для аудиокниг.
  • LRF — также: BBeB book. Собственный формат Sony. Поддерживается Sony Librie и Sony Reader.
  • LRS — также: BBeB Xylog XML. Формат исходного кода для книг BBeB, который скомпилирован в LRF для чтения на устройстве.
  • LRX — защищенный документ BBeB. Sony Librie и Sony Reader используют несовместимые друг с другом форматы.
  • MART — это проприетарный формат, используемый только на веб-сайте Martview для распространения книг, состоящих из изображений.
  • Формат NP — формат загрузки газеты, используемый в NewspaperDirect для их продукта PressDisplay.
  • OEB — формат открытой книги. Формат электронной книги, используемый EBookwise-1150, MobiPocket и Microsoft Reader. Этот стандарт является старой версией ePUB.
  • ODT — это открытый стандарт, формат документа, используемый в OpenOffice.org, Star Office и многих других текстовых редакторах.
  • OSIS — это определение XML-схемы для Библии и других библейских текстов исследований.
  • PKG — формат, используемый в Apple Newton.
  • PNPd — Формат, используемый программой eReader. Это популярный формат (также известный как PML).
  • PS — Postscript поддерживается в нескольких программах для чтения, но предназначен для отправки информации на принтер.
  • RB — формат электронной книги для Rocket eBook и Gemstar RCA REB 1100.
  • RTF — Rich Text Format — это формат обмена документами, поддерживаемый некоторыми программами чтения электронных книг, а также многими приложениями обработки Word, включая MS Word и OpenOffice. Это предпочтительный формат для многих пользователей, которые создают свой собственный контент для Sony Reader.
  • SGF — собственный формат для Sigil, прямого редактора для ePUB. (Больше не используется)
  • STK — собственный формат STAReBOOK.
  • TCR — электронная книга для EPOC.
  • TeBR — специальный формат для крошечной электронной книги от Fictionwise.
  • TR — формат Tome Raider. Их последний формат называется TR3. Tome Raider — это формат электронных книг, который поддерживает очень большие книги, такие как справочники, энциклопедии и словари.
  • VBK — формат электронной книги от VitalSource, поддерживающий графическую поддержку. Этот формат обычно используется в учебниках.
  • XEB — формат, используемый электронными книгами Apbi в основном на китайском языке.
  • XDXF — формат обмена словарями на основе XML.
  • WOLF — Собственный формат, используемый HanLin eBook в своих электронных книгах V2B, V3 и V8. Обычно используется расширение .wol. Также используется JCNIP на их читаталке Dr.Yi.
  • ZTXT — формат, используемый WeaselReader на устройствах Palm. Имеет расширение .pdb.
  • ZNO — проприетарный формат электронных журналов подписки Zinio. Эти журналы включают мультимедийные материалы, такие как фотографии и видео. Ходят слухи, что формат основан на DJVU.

Пожалуй мы покончим с экзотикой на этом месте. Спасибо за внимание!

Присоединяйтесь к нам, чтобы получать новые статьи и узнавать о выходе в свет книг на нашей платформе.

Сегодня устройства для чтения электронных книг набирают всё большую популярность и интернет-магазин Amazon.com в этом году впервые продал электронных версий книг больше, чем бумажных. Но тем людям, которые пользуются электронными читалками нужно знать, какие основные форматы электронных книг существуют на рынке и на просторах интернета. В этой статье я расскажу о том, какие форматы книг есть, немного о том, какие ещё будут.

Существуют несколько “видов” электронных книг: самые распространённые форматы можно купить в любом популярном и, естественно, имеющем лицензию на распространение, интернет-магазине, например, Ozon.ru.

Основные форматы электронных книг.

Эти форматы имеются в наличии в любом хорошем интернет-магазине и прочитать их можно на любой современной электронной книге.

TXT – электронные книги этого формата занимают имеют самый маленький размер. Именно этот формат стал наиболее популярным в прошлом, так как устройства имели жесткие диски малых размеров, а скорость интернета была очень низкой. Форматы TXT можно читать на любом современном устройстве, без каких либо ограничений. Этот формат прост, а потому не имеет сложного форматирования и какой-то графики.

Формат электронных книг PDF

PDF – формат электронных книг, который создала компания Adobe System. Этот формат поддерживается почти всеми электронными читалками. Можно сказать, что сегодня он один из самых популярных форматов. Использует ряд возможностей специального языка PostScript. Он позволяет внедрять в текст векторные или растровые изображения, мультимедиа, различные формы.

Формат электронных книг FB2

FB2 – на сегодняшний день, пожалуй, самый популярный формат электронных книг  среди читателей. Очень удобен и практичен для чтения. Воспринимается отлично любой современной электронной книгой, например, на своей электронной книге G-Mini MagikBook M6P я стараюсь читать книги именно этого формата. Основан этот формат на языке XML. FunctionBook (полная версия названия формата), позволяет организовать структуру книги. В этот формат можно преобразовывать книги любого другого размера в автоматическом режиме.

Формат электронных книг EPUB

EPUB – ещё один очень распространённый формат электронных книг тоже основанный на стандарте XML. Позволяет воспроизводить незашифрованные книги и публикации с большой долей совместимости с программами и аппаратами, что достигается изготовлением производителем цифровой публикации в одном файле

Другие форматы электронных книг.

Форматы электронных книг могут быть прочитаны на компьютере, но не на каждом устройстве для чтения электронных книг. Поэтому, будьте внимательнее, прочитайте подробно поддерживаемые форматы электронных книг.

RTF – имеет поддержку большинства текстовых редакторов. Его происхождение – операционная система Windows. Этот формат может выделить фрагменты текста жирным, курсивом или колонками. Может не воспроизводиться на некоторых устройствах, в зависимости от сложности самой электронной книги.

CHM – Этот формат пришел тоже из стана Widows и имеет даже название – HTMLHelp для чтения файла помощи пользователей. Содержит в себе множество HTML-страниц. Сохраняет структурированность книги. Из-за своего принципа работы нет возможности воспроизводить этот формат на части электронных книг.

HTML – это обычный и знакомый многим язык разметки интернет страниц сайтов. Также применяется для электронных книг. Он позволяет вставлять в книгу спецсимволы, различные размеры текста, начертания самого шрифта, встраивать в текст ссылки и таблицы. Чаще используется просто на страницах сайтов.

XML – электронные книги этого формата имеют текстовую составляющую, предназначенную для структурированных данных и их хранения. Он позволяет обмениваться данными между программами и создавать на его основе более специализированную разметку. XML позволяет сразу приступить к чтению или же сразу переконвертировать в другой формат электронных книг, именно на его основе создан формат FunctionBook (FB2).

Специализированные форматы электронных книг.

Иногда производители разрабатывают свой формат электронных книг, наверное, для того, чтобы пользователь всегда пользовался только их устройствами. Но на сегодняшний день существует масса конвертеров, которые сконвертирую один формат электронной книги в другой.

Формат электронных книг LIT для Microsoft Reader

LIT – фирменный формат от компании Microsoft. Он имеет достаточное распространение, но у него имеется некоторые проблемы, так как читается он в основном с помощью специального ПО – Microsoft Reader. Очень похож на формат PDF, так как может масштабироваться, имеет аннотации и закладки.

Формат электронных книг MBR для MobiPocket

MBR – это формат электронных книг называется MobiPocket и разрабатывается французской компанией с таким же названием. Используют его в большинстве случаев для чтения на коммуникаторах и КПК.

Формат электронных книг LRF для Sony Reader

LRF – формат электронных книг разработанный компанией Sony для bookreader своего производства. Применяется только в читалках собственного производства. Есть несколько конверторов как в него, так и в другие форматы.

Формат электронных книг AZW для устройств Amazon Kindle

AZW – этот коммерческий формат образован из формата mobi для использования в электронных книг DRM-защиты. А mobi такой защиты не имеет. Используется только в электронных книгах от компании Amazon Kindle, возможно позже получит распространения для охраны авторских прав. Компания Amazom следит за книгами на читалках Kindle и при нарушении авторских прав может массово удалять книги с устройств через интернет.

В ближайшем будущем появится формат под название FB3. Он будет удовлетворять возросшие потребности потребителей (вот такой каламбур) в форматировании электронных книг и их каталогизации. Современные стандарты позволяют привести к самым перспективным наработкам и сделать его самым удачным. Формат АИ3 разрабатывается по стандарту Open Packaging Convention (ECMA-376 Part 2). В этом формате можно будет использовать изображения в виде SVG-файлов и GIF-файлы, патент на которые уже закончился.

Вот такие основные форматы сегодня имеют электронные книги. Перед покупкой электронного формата книги нужно быть уверенным в том, что формат поддерживается вашим устройством, в противном случае вам придётся конвертировать книгу из одного формата в другой. В абсолютном большинстве случаев форматы книг, представленные в основных, читаются на всех современных читалках. Будьте уверенны и приятного чтения вам.

Буду очень благодарен, если вы поделитесь с друзьями этой статьёй в социальных сетях и блогах, это будет здорово помогать моему блогу развиваться:

Хотите получать обновления блога? Подписывайтесь на рассылку и внесите свои данные: Имя и е-мейл

ehlektronnayakniga.ru

электронная книга формат doc

На удивление, для такой достаточно простой вещи, как электронная книга, придумано огромное количество разных форматов. Порой кажется, что каждый производитель устройств для их чтения считает своим долгом придумать здесь что-то свое. Чем же они отличаются друг от друга, какие ридеры что понимают и что делать, если ваша «читалка» не способна открыть нужный файл – обо всем этом в статье.

КАКИЕ БЫВАЮТ ФОРМАТЫ

AZWФирменный формат Amazon, используемый им в своих ридерах семейства Kindle (AZW предположительно расшифровывается как Amazon Word). Основан на стандарте Mobipocket (разработчика которого Amazon приобрела в 2005 г.) и практически полностью его повторяет, за исключением нюансов вроде отсутствия поддержки JavaScript и использования компрессии. Книги в AZW могут быть как с DRM-защитой, так и без нее. Защита привязывает книгу к аккаунту, с которого была совершена покупка, поэтому прочитать ее можно будет на всех устройствах, связанных c ним (всего на одном аккаунте может находиться до шести устройств). Формат AZW поддерживает использование дополнительных файлов, в которых хранятся закладки, цитаты, прогресс чтения и некоторые другие метаданные.

Кроме того, недавно появилась новая версия формата – AZW4, на данный момент используемая только в программных ридерах для Windows и Mac, в будущем его добавят и в ридеры на мобильных платформах. По своей сути это PDF, и Amazon называет его «Print Replica», имея в виду, что это точная копия печатной страницы. Кроме обычной функциональности формата PDF, AZW4 также поддерживает уникальные возможности Kindle – аннотации, синхронизацию чтения между разными устройствами и т.д.

BBeB (.lrf; .lrx)Broadband eBooks, или BBeB – формат, разработанный Sony для своих ридеров по спецификациям формата Xylog XML. Расширение LRF предназначено для незащищенных документов, LRX – соответственно, для файлов с DRM-защитой. Летом 2010 г. Sony отказалась от применения этого формата в своем онлайновом магазине в пользу ePub, и последняя на данный момент модель ридера, PRS-T1, также не поддерживает формат BBeB.

CHMПолное название – Microsoft Compiled HTML Help. Проприетарный формат контекстной справки от Microsoft, основанный на HTML. В отличие от последнего, может содержать в одном файле набор страниц и графических изображений. В контексте электронных книг может быть интересен в основном как формат, используемый для хранения какой-либо документации, поскольку обычные книги в нем не распространяются. Разновидностью CHM является формат LIT (сокращение от literature), используемый в ПО Microsoft Reader (поддержка которого, а также использование формата LIT, будет прекращена в августе 2012 г.)

DjVuФормат предназначен для хранения сканированных документов. Благодаря сложным алгоритмам обработки, разделяющих текст и графику в различные слои с разными методами компрессии, удается достичь небывалой степени сжатия – при сопоставимом с PDF качестве документ в DjVu будет в 10 раз меньше. Это делает DjVu оптимальным вариантом для хранения больших массивов технической документации с графическими иллюстрациями. Стоит отметить, что при наличии в таком файле текстового слоя пользователю будет доступен полноценный поиск по документу. Если же используется только один графический слой, такой вариант формата называется IW44, и некоторые ридеры отдельно указывают его в списке поддерживаемых – хотя на самом деле любое устройство, способное открыть DjVu-документ, не испытает никаких проблем с IW44-файлами.

ePubНазвание является сокращением от electronic publication. Открытый формат, разработанный Международным форумом по цифровым публикациям (International Digital Publishing Forum). ePub основан на XHTML и XML с опциональным использованием таблицы стилей CSS. Формат разрабатывался для документов с плавающей версткой, что позволяет адаптировать отображение книг к экранам различных устройств. ePub пришел на смену предыдущему стандарту данной организации — Open eBook. Контейнер ePub является на самом деле Zip-архивом с расширением .epub – в нем находятся тексты в форматах xHTML, HTML или PDF. Также контейнер может содержать файлы с графикой, в том числе векторной, и встроенные шрифты. Последняя на сегодня версия 3.0 призвана устранить недостатки, за которые ePub критиковали ранее – недостаточную приспособленность формата для использования в книгах с фиксированной версткой, отсутствие поддержки математических выражений MathML и ряд других.

На данный момент ePub является наиболее распространенным форматом и поддерживается почти всеми современными ридерами (за исключением разве что Amazon Kindle). Стандарт ePub позволяет включать в файл DRM-защиту, при этом спецификация не ограничивает издателя в ее выборе.

FB2FB2, или FictionBook version 2, основан на формате XML. По словам разработчика, основными задачами при его создании были полное сохранение структуры документа с возможностью легкого (в идеале – автоматического) преобразования в другие форматы и точное отображение на любом устройстве. Отличием от остальных форматов является именно упор на сохранение структуры, а не внешнего вида – FB2 не определяет, как документ будет отображаться на различных устройствах или выводиться на печать, вместо этого применяются специальные элементы для указания различных частей книги, как-то цитаты, эпиграфы, стихи и т.д. Книга в FB2 хранится в одном XML-файле – включенные в нее изображения преобразуются в систему Base64 и вставляются в него с помощью специального тега, что несколько увеличивает размер файла.

Формат разработан в России, неудивительно поэтому, что особую популярность он заслужил именно в русскоязычной среде – его поддержка присутствует у всех ридеров локальных брендов, кроме того, ряд онлайновых библиотек и магазинов Рунета предлагают книги в FB2.

В конце 2008 г. появилась первая информация о разработке следующей версии формата, FictionBook 3.0, однако дальше его описания дело, похоже, так и не пошло, хотя возможности выглядели достаточно перспективно (использование стандарта Open Packaging Convention, контейнер в виде Zip-архива с отдельными файлами для текста, изображения и метаданных и т.д.).

KF8Новый формат электронных книг, разработанный Amazon для своего планшета Kindle Fire (аббревиатура расшифровывается незамысловато – Kindle Format 8). KF8 основан на ePub, использует базу данных Palm (при этом база MOBI в файле также присутствует для сохранения обратной совместимости) и фирменную DRM-защиту. Преимуществом KF8 является расширенная функциональность – так, он поддерживает HTML5-теги, элементы CSS3, встроенные шрифты (спасибо ePub), систему всплывающего текста и ряд других возможностей. Сам Amazon заявляет, что KF8 пришел на смену Mobi – это позволяет предположить, что перевод на данный формат и традиционных ридеров на электронной бумаге Kindle лишь дело времени.

MOBIФормат, используемый в бесплатном ПО MobiPocket Reader (доступен под Windows, а также на мобильных платформах: BlackBerry, PalmOS, Symbian и Windows Mobile). Основным «потребителем» книг в формате MOBI является семейство ридеров Amazon Kindle, у которых это, по сути, единственный неродной поддерживаемый формат. Книги в MOBI могут быть с расширениями .mobi и .prc (второе было введено из-за ограничений PalmOS на используемые расширения). Изначально формат MOBI был основан на формате PalmDOC, в который добавили некоторые HTML-теги, впоследствии появилась новая версия, использующая более высокую степень компрессии данных. В последнее время при добавлении новых функций создатель следует стандарту Open eBook. При этом у MOBI есть достаточно большое количество ограничений на форматирование, в первую очередь касательно отступов текста, а также вставленных в текст изображений и таблиц.

PDFРазработанный Adobe в далеком 1993 г. формат Portable Document Format, или сокращенно PDF, отлично подходит для современных устройств для чтения книг. Изначально формат разрабатывался для печати, поэтому полностью описывает то, как документ должен выглядеть – включая размер бумаги, виды шрифтов (которые могут включаться в состав документа) и т.д. Кроме текста, PDF может содержать векторную и растровую графику, а также метаданные. Именно с помощью PDF пользователи ридеров могут добавлять недостающую в их устройствах функциональность, вроде альтернативных шрифтов, переносов в русском тексте и т.д.

Основная проблема PDF-файлов, не оптимизированных для устройств с маленьким экраном – проблемы с чтением страниц, создававшихся, как правило, под разрешение мониторов (в первую очередь это касается PDF-версий журналов, а также технической литературы). В таком случае пользователю приходится то и дело переключаться с просмотра всей страницы целиком на увеличенный участок. Некоторые ридеры поддерживают функцию reflow, позволяющую менять верстку в зависимости от размера экрана и степени масштабирования, однако работает она, как правило, не лучшим образом.

КАКИЕ ФОРМАТЫ ПОДДЕРЖИВАЮТСЯ РАЗЛИЧНЫМИ РИДЕРАМИ

Поддержка форматов в разных моделях осуществляется по-разному, но основная тенденция такова: как правило, крупные бренды, имеющие к тому же собственный сервис цифровой дистрибуции книг, ограничиваются минимальным джентльменским набором, включающим свой основной формат плюс наиболее популярные документы – PDF, TXT. С их точки зрения, больше пользователю все равно ничего не понадобится, ведь все книги он будет покупать в фирменном магазине. Если же производитель не привязывает свой ридер к какому-то определенному сервису, поддержка форматов у него будет, скорее всего, гораздо более обширная.

Некоторые популярные модели ридеров и список поддерживаемых ими форматов:

Amazon Kindle 4AZW, MOBI, PDF, PRC, TXT
Barnes & Noble Nook Simple TouchEPUB, PDF
Ergo Book 0604RCHM, EPUB, FB2, HTML, PDB, PDF, RTF, TXT
Impression ImBOOK 0311EPUB, FB2, HTML, LRC, MOBI, PDF, RTF, TXT, PDB
iRiver Story HD EB07DJVU, DOC, DOCX, EPUB, FB2, PDF, TXT
Kobo Touch eReaderEPUB, HTML, MOBI, PDF, RTF, TXT
lBook eReader V60CHM, DJVU, DOC, EPUB, FB2, HTML, LIT, MOBI, PDB, PDF, PRC, RTF, TXT
PocketBook Pro 612CHM, DJVU, DOC, DOCX, EPUB, FB2, HTML, IW44, IW4, MOBI, PDF, PRC, RTF, TCR, TXT
PocketBook 360 PlusCHM, DJVU, DOC, DOCX, EPUB, FB2, HTML, PDF, PRC (mobi), RTF, TCR, TXT
Prestigio PER5162CHM, DJVU, DOC, EPUB, FB2, HTML, MOBI, PDB, PDF, RTF, TXT
Qumo Libro IICHM, DJVU, DOC, EPUB, FB2, HTML, MOBI, PDB, PDF, RTF, TXT
Sony Reader Wi-Fi PRS-T1EPUB, PDF, TXT
Wexler Book E5001CHM, DJVU, DOC, EPUB, FB2, HTML, PDF, RFT, TXT

ЧЕМ КОНВЕРТИРОВАТЬ КНИГИ

Как видим, форматов много, ридеров тоже, и далеко не все ридеры понимают все или хотя бы бОльшую часть форматов. Что же делать, если у вас появилась книга в формате, с которым ваш ридер незнаком? Воспользоваться конвертером. Их тоже существует достаточное количество, однако безусловным лидером является Calibre, (см. наш обзор) – хоть он и позиционируется разработчиком как «ультимативное решение для всех задач, связанных с электронными книгами», в первую очередь это все же именно отличное средство для конвертирования книг в различные форматы.

ehlektronnayakniga.ru


Смотрите также