小喵的唠叨话:寒假的时候写了一个漫画爬虫,爬取了好几个漫画,不过一直没有找到合适的漫画阅读的工具。因此最近就试着自己写一个漫画的网站,放在公网上或者局域网里,这样就能随时随地用手机、Pad看漫画了。

先放上项目的地址:https://github.com/miaoerduo/cartoon-cat-server ,欢迎大家随时star、fork和指教。

关于漫画爬虫的内容,请参看之前的博客:http://www.miaoerduo.com/python/爬虫-漫画喵的100行逆袭.html

本文系原创,转载请注明出处~

小喵的博客:http://www.miaoerduo.com

博客原文:http://www.miaoerduo.com/nodejs/简易漫画网站搭建-漫画喵server版.html ‎

写在前面

这里,我们先试着思考几个问题:

1、为什么要做一个漫画网站,而不是APP呢?

小喵最开始其实是打算做一个QT的漫画阅读软件,这样能够在各种操作系统上用。开发了一小段时间之后,觉得用手机或者Pad看漫画的情况会更多。难道要给手机、平板甚至是PC都编写一套软件吗?这个小喵确实能力上达不到。其次是,如果是本地的APP的话,图片可能还是需要存到设备上,这样同样很麻烦。于是,漫画网站就成为最适合的选择,只要在联网的情况下(或者在同一个局域网中),只要有浏览器,就能够看漫画。这才是真正的跨平台,也是小喵要编写这个工具的原因。

2、那么,一个简单的漫画网站可以怎么去实现呢?

讲道理的话,其实单纯的静态的网页可能就足够了,给每个漫画图片编写一个页面,包含图片、下一页、上一页等部分就可以。页面的生成可以是一个脚本程序。不过这样的话,也有点麻烦,而且最终的页面的数目可能会很多。小喵不喜欢这种方式。
这里,小喵采用的方式是前、后端分离的方式。
整个网站由三个部分组成:

  • 数据:也就是漫画本身。
  • 后台:后台程序的功能是根据请求返回用户漫画的列表、章节和图片URL等信息。
  • 前端:调用后台的程序,得到漫画的信息并友好的进行显示。

3、最后,我们使用什么技术来实现呢?

前端的话,使用标准的Html,Css和Js就可以。后台是个API Server,Python + Flask 或者 Nodejs + Express 都是不错的选择(使用起来很简单。。。),小喵这里就选用 Nodejs + Express 的方式编写后台(一直写Js就可以了 :P )。另外,大型的漫画网站,漫画的信息应该会存到数据库中,这样会方便查找和管理。这里考虑到漫画数目比较少,就去掉了数据库这一步骤,直接通过文件操作来得到漫画信息,工作量也大大减少了。

先看一下最终的效果图(虽然界面很简单):

简易漫画网站搭建-漫画喵Server版-LMLPHP

图1 网站的最终效果图

现在,喵粉们是不是已经迫不及待的想要动手写代码了呢?

一、目录结构

下面是小喵的目录结构:

$ tree blog -N -L
blog
├── README.md
├── main.js
├── package.json
└── public
├── api.html
├── cartoon.html
├── chapter.html
├── css
├── img
├── index.html
├── js
└── store

main.js 这里就是后台API的程序。因为功能很简单,所以就放在一个文件中。

package.json 是nodejs的包管理器,在这里可以定义依赖。我们这里只依赖Express。

public 这个文件夹用来存放静态的资源,包括Html、Css、js、image以及漫画资源(store)。

二、后台程序

1. 依赖安装

原生的 Nodejs 就已经十分适合写API程序了,Express 只是让它更加的方便了而已(至少对于这个项目来说)。

Nodejs 的安装十分简单,在官网上 https://nodejs.org 有下载链接,服务器上使用 apt-get 等工具也很容易安装。

Express 的话,可以使用npm install express —save 来安装。这里小喵使用的package的方式来安装。在项目根目录新建package.json文件,写入配置信息:

{
"name": "cartoon-cat-server",
"version": "0.0.1",
"dependencies": {
"express": "visionmedia/express"
}
}

之后使用 npm install 命令就可以完成安装。安装完成之后会发现根目录多了一个 node_modules 文件夹,里面就是我们的依赖库了。喵粉们如果下载了我的这个项目的话,第一步也是要进入项目目录然后输入 npm install

2. 漫画的文件结构

我们的漫画资源都是通过 漫画喵 这个爬虫工具下载下来的,因此漫画都是每个章节都是一个文件夹,每个章节的漫画图片都放在对应的文件夹中,而且按照页码来命名。

这样通过遍历文件夹似乎就能获取漫画的信息了!

漫画列表和章节中的图片列表都可以通过上述的方式来解决,但是章节的列表却不行。因为漫画的章节有时候并没有明确的顺序(比如突然出现一个番外篇啥的),这样遍历文件夹默认的顺序(按名称)就可能是错误的。

我们有两个解决办法:

  1. 按照文件夹的创建时间来显示文件名。这样有点不灵活。
  2. 在每个漫画的根目录建一个文本文件,用来存放章节的信息。

小喵选择第二种策略,创建这个list的方法十分简单粗暴,在漫画目录下面使用:

ls -t -r > index

ls 是linux上面的显示目录的工具,-t 表示按时间排序(最上面是最新的),-r 表示倒序,> 是重定向,最终输出到index这个文件。然后编辑这个文件,删掉index这一行(系统貌似是先生成index这个文件,然后再执行ls,最后把结果输入到文件中,因此文件里面多了一个index的文件名),再做一些必要的调整。

Windows上可以使用:

dir /OD /B > index

dir 是windows的查看目录的命令,/OD 表示按照时间排序,/B 表示只显示文件名,> 重定向到index。windows上的这个列表文件中也会出现index这个文件名(看来各种操作系统都一样)。另外需要注意的是windows的换行和linux或mac不一样。

这样,我们就可以通过读这个index文件来获取章节的信息了。

最终的漫画的结构(为了显示的方便,删除了很多图片和章节)如下:

$ tree store -N -L
store
├── 犬夜叉
│ ├── index
│ ├── 第1章
│ │ ├── .jpg
│ │ └── .jpg
│ └── 第2章
│ ├── .jpg
│ └── .jpg
└── 极黑的布伦希尔特
├── index
├── 第1章
│ ├── .jpg
│ └── .jpg
└── 第2章
├── .jpg
└── .jpg

3. API 编写

Express十分的容易使用。这里小喵给一个官网的Hello World的教程让大家看一下:

var express = require('express')
var app = express() app.get('/', function (req, res) {
res.send('Hello World!')
}) app.listen(3000, function () {
console.log('Example app listening on port 3000!')
})

将上述代码保存成 main.js,使用 node main.js 就可以启动这个程序,然后用浏览器访问 http://localhost:3000 ,就能看到一个显示着 hello world 的页面。

require 语句用来引入依赖,app 是express的封装的对象。通过 app.get 方法就可以给指定的url(官方说法叫route)绑定相应的处理方法(GET方法的请求)。处理函数有2个参数 req 表示request,也就是用户的请求,通过这个对象我们可以获取用户的输入的参数,res 表示response,是一个向用户返回数据的对象。

listen 用来监听一个端口启动服务。

这里小喵先给出自己定义的一些辅助的函数,定义错误信息和参数校验,后面会使用到:

// 引入依赖
var express = require('express');
var fs = require("fs"); // 即file system,用来进行文件操作
var app = express(); /**
* 错误提示
*/
var ErrorHelper = {
'internal_error': function () {
return {
'msg': 'something wrong with server',
'code': 1
};
},
'missing_param': function (param) {
return {
'msg': 'missing param: ' + param,
'code': 2
};
},
'error_param': function (param, data) {
return {
'msg': 'the param ' + param + '(' + data + ') is illegal',
'code': 3
}
},
'not_found': function (param) {
return {
'msg': 'cannot find ' + param,
'code': 4
};
}
}; /**
* 检查参数格式,只能输入字母,数字和汉字
*/
function checkParam(param) {
return /^[\u4e00-\u9fa5_a-zA-Z0-9]+$/.test(param);
}

1) get_cartoon_list

这个接口用来获取所有的漫画列表。

/**
* 获取漫画列表
*/
app.get('/get_cartoon_list', function (req, res) {
fs.readdir(__dirname + '/public/store', function (err , files) {
if (err) {
res.jsonp(ErrorHelper.internal_error());
}
res.jsonp({'cartoon': files, 'code': 0});
});
});

这个函数十分的简单,通过 fs 读取store中的文件名,然后用json的格式返回回去。这里小喵用的jsonp,为了解决跨域请求的问题,不过我们的页面和服务是一台机器的,所以这部分并不需要。

2) get_chapter_list

这个接口用来获取漫画的章节的信息,所以需要输入参数,这里定为cartoon。

/**
* 获取章节信息
*/
app.get('/get_chapter_list', function (req, res) { var cartoon = req.query.cartoon;
if (!cartoon) {
res.jsonp(ErrorHelper.missing_param('cartoon'));
return;
} if (!checkParam(cartoon)) {
res.jsonp(ErrorHelper.error_param('cartoon', cartoon));
return;
}
var cartoon_dir = __dirname + '/public/store/' + cartoon;
fs.exists(cartoon_dir + '/index', function (exists) {
if (!exists) {
res.jsonp(ErrorHelper.not_found(cartoon));
return;
}
fs.readFile(cartoon_dir + '/index', function (err, data) {
if (err) {
res.jsonp(ErrorHelper.internal_error());
return;
} var chapter_list = data.toString().split('\n').filter(function (d) {
return d.length > 0;
}); res.jsonp({'chapter': chapter_list, 'code': 0});
});
});
});

首先判断输入的参数,之后判断对应漫画的文件夹中是否有index这个文件,如果有的话就读取然后返回给用户。

3) get_img_list

这个接口用来返回漫画的具体章节的图片的URL,用户需要输入漫画名(cartoon)和章节名(chapter)。注意要修改自己的HOST的地址。

var HOST = "localhost"; // 如果不是在本机上使用,请改成实际的ip地址
// 后面的图片的URL会使用这个变量来构造
var PORT = 3000; app.get('/get_img_list', function (req, res) { var cartoon = req.query.cartoon;
if (!cartoon) {
res.jsonp(ErrorHelper.missing_param('cartoon'));
return;
}
if (!checkParam(cartoon)) {
res.jsonp(ErrorHelper.error_param('cartoon', cartoon));
return;
}
var chapter = req.query.chapter;
if (!chapter) {
res.jsonp(ErrorHelper.missing_param('chapter'));
return;
}
if (!checkParam(chapter)) {
res.jsonp(ErrorHelper.error_param('chapter', chapter));
return;
} var cartoon_dir = __dirname + '/public/store/' + cartoon;
fs.exists(cartoon_dir + '/index', function (exists) {
if (!exists) {
res.jsonp(ErrorHelper.not_found(cartoon));
return;
}
fs.readdir(cartoon_dir + '/' + chapter, function (err, images) {
if (err) {
res.jsonp(ErrorHelper.error_param('chapter', chapter));
return;
}
// 按名字排序
images.sort(function (lhs, rhs) {
return parseInt(lhs.split('.')[0]) - parseInt(rhs.split('.')[0]);
}); var urls = images.map(function (image) {
return 'http://' + HOST + ':' + PORT + '/store/' + cartoon + '/' + chapter + '/' + image;
});
res.jsonp({'img': urls, 'code': 0});
});
});
});

这是目前最复杂的函数了,先检查参数,然后判断漫画是否存在,再判断章节是否存在,列出章节文件夹里面的图片名,并按数字的顺序排序。最终构造成URL,返回给用户。

4) 静态资源

public文件夹中的资源都是静态资源,用户可以通过URL访问。在这里Nodejs也是支持的:

app.use('/', express.static('public'));

不过Nodejs本身并不适这种静态资源的工作,所以如果是生产环境中,建议大家还是使用Nginx等工具,让Nodejs安心的处理业务逻辑吧。

5) 启动服务

var server = app.listen(PORT, function () {
console.log("应用实例,访问地址为 http://%s:%s", HOST, PORT);
});

三、前端

1. Ajax

前端使用Ajax就可以很容易完成,相信即使是前端小白也能实现,而且还比小喵做的好看(无奈脸)。小喵使用了JQuery 来处理Ajax的内容,界面库使用了Metro,然而即使这样也没有提高网站的颜值。

源码可以从github上下载到,所以小喵就不重点介绍前端了。

2. 懒加载

有一点需要注意,在漫画图片的页面中,通常会出现大量的图片,如果只是简单的使用 img 标签的话,可能会导致浏览器同时加载所有的图片,如果网速不好的话,我们的体验也会相当的差(局域网请无视)。所以我们使用一种懒加载的策略,只有可见的图片才会加载。然后小喵就从github上找相关的插件,然后发现了一个使用比较方便的代码,还有详细的原理介绍,感兴趣的话大家可以看一下。

图片懒加载插件实战:http://www.cnblogs.com/beidan/p/5648240.html
插件的github:https://github.com/beidan/lazeLoadImg

四、写在后面

至此,我们就搭建好了一个可以随时玩耍的个人漫画网站了。喵粉们感兴趣可以star、fork这个项目,如果喜欢开发的话,能帮忙一起提高网站的颜值就更好了 O(∩_∩)O哈!

项目地址:https://github.com/miaoerduo/cartoon-cat-server ,欢迎大家随时star、fork和指教。

PS. 请搭配漫画喵爬虫版一起食用:https://github.com/miaoerduo/cartoon-cat

使用的话,按如下的流程:

git clone [email protected]:miaoerduo/cartoon-cat-server.git
cd cartoon-cat-server
npm install
node main.js

另外,为了避免程序突然崩掉,建议大家使用forever这个工具。上面的流程的最后一句node main.js就可以改成下面的。

npm install forever -g
forever start main.js

这样,我们的程序就更健壮了。

最后,小喵再说一句,这个项目有很多的缺陷,比如直接访问文件,Nodejs直接管理静态文件,需要提供奇怪的参数,没有验证用户等等。因此不适合真的生成中的使用。不过,自娱自乐应该是足够了。小喵自己是放在宿舍的树莓派里,睡前躺床上看会儿漫画。

觉得不错的话,请点个大大的推荐~~

希望小喵能和大家一起学习和进步~~

转载请注明出处~

05-04 01:15