Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Appearance settings

Newbilius/habr_to_fb2

Open more actions menu

Repository files navigation

Скачиваем избранное хабрахабра в формат fb2

В принципе, скрипт уже работает - прописываем в файле config.php в переменной $login нужный логин, переходим на страничку index.php - и запускаем скачивание. Полноценный аккаунт не нужен, ключи разработчика не нужны, работает быстро, памяти много не ест.

Конфигурируется через файл config.php.

Есть проблема - не идеальная и не 100% конвертация из HTML в fb2. На некоторых статьях может генерироваться битый код, который ломает дальнейший просмотр книги. Причина - не найден надежный способ заменять тэг <br>. При замене на </empty-line> файл становится корректным с точки зрения XML, но часть читалок файл не принимает. С точки зрения стандарта нельзя использовать </empty-line> внутри <p></p>. Так что читаемость получившегося файла зависит от читалки. (Cool Reader, например, прочитает с любыми ошибками, FBReader - уже нет).

Неудачно скачанные картинки, статьи или файлы просто отбрасываются, а информация об ошибке записывается в лог.

Update от 27.02.2013. Теперь можно сохранять и комментарии к статьям (выключено по-умолчанию, настраивается в файле config.php, увеличиваем время генерации, размер файла, комментарии отображаются линейно, из комментариев удаляются картинки).

Скрипт не для коммандной строки - запускается через браузер. (я знаю про php-cli, позже будет реализовано).

В данный момент есть мысли на основе этого конвертера сделать конвертер в epub-формат.

About

Экспорт избранного хабрахабра в fb2

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages

Morty Proxy This is a proxified and sanitized view of the page, visit original site.