Электронная книга из блога

Захотелось сделать из своего старого блога электронную книгу. Есть сервис http://newstoebook.com/ который при наличии RSS отлично справляется с этой задачей, но в RSS старого блога видно только 10 последних записей, поэтому решил попробовать сделать сам.

Задача, сразу скажу, нетривиальная и вряд ли стоит описывать процесс подробно.

Пока удалось следующее: с помощью скрипта на Python’е скомпилировать все посты (вместе с комментариями) в один html-файл, убрать всё лишнее (меню, боковую панель, форму для отправки комментариев и прочее), конвертировать в epub, mobi, fb2, pdf с помощью calibre из того же скрипта.

Пока что главная задача, придумать, как скриптом вытянуть все нужные картинки и упаковать их вместе с текстом, а еще с помощью css сделать книгу более читабельной, потому что выглядит она ужасно. Дальше нужно будет разбираться с особенностями каждого формата.

b2ap3_thumbnail_-2013-12-20-01.15.18.jpg