什么是镜像?

镜像可以看成是由多个镜像层叠加起来的一个文件系统(通过UnionFS与AUFS文件联合系统实现),镜像层也可以简单理解为一个基本的镜像,而每个镜像层之间通过指针的形式进行叠加。

码农浅知-Dockerfile自定义镜像详细教程and实战演练

码农浅知-Dockerfile自定义镜像详细教程and实战演练

根据上图,镜像层的主要组成部分包括镜像层 ID、镜像层指针 「指向父层」、元数据「 Layer Metadata,包含了 Docker 构建和运行的信息和父层的层次信息」。只读层和读写层「Top Layer」的组成部分基本一致,同时读写层可以转换成只读层「 通过docker commit 操作实现」。

元数据(metadata)就是关于这个层的额外信息,它不仅能够让Docker获取运行和构建时的信息,还包括父层的层次信息。需要注意,只读层和读写层都包含元数据。

码农浅知-Dockerfile自定义镜像详细教程and实战演练

每一层都包括了一个指向父层的指针。如果一个层没有这个指针,说明它处于最底层。

码农浅知-Dockerfile自定义镜像详细教程and实战演练

在docker主机中镜像层(image layer)的元数据被保存在名为”json”的文件中,一个容器的元数据好像是被分成了很多文件,但或多或少能够在/var/lib/docker/containers/目录下找到,就是一个可读层的id。这个目录下的文件大多是运行时的数据,比如说网络,日志等等。

镜像是一堆只读层的统一视角,除了最底层没有指向外,每一层都指向它的父层。统一文件系统( Union File System)技术能够将不同的层整合成一个文件系统,为这些层提供了一个统一的视角,这样就隐藏了多层的存在。在用户的角度看来,只存在一个文件系统。镜像每一层都是不可写的,都是只读层。

码农浅知-Dockerfile自定义镜像详细教程and实战演练

我们可以看到镜像包含多个只读层,它们重叠在一起。除了最下面一层,其它层都会有一个指针指向下一层。这些层是Docker内部的实现细节,并且能够在docker主机的文件系统上访问到。统一文件系统(union file system,升级版为AUFS)技术能够将不同的层整合成一个文件系统,为这些层提供了一个统一的视角,这样就隐藏了多层的存在,在用户的角度看来,只存在一个文件系统。

什么是Dockerfile

Dockerfile 是由一系列命令和参数构成的脚本,这些命令应用于基础镜像并最终创建一个新的镜像。它们简化了从头到尾的流程并极大的简化了部署工作。Dockerfile 从 FROM 命令开始,紧接着跟随着各种方法,命令和参数。其产出为一个新的可以用于创建容器的镜像。

Dockerfile 语法由两部分构成,注释和命令+参数,注释是不能少的,因为明天可能就忘记写的是什么了。说白了, Dockerfile 是告诉 docker 怎么样制作一个镜像,就像我们写代码告诉应用怎么执行一条逻辑,这样应该好理解了,所以可以在 Dockerfile 中写明,我们需要怎么个执行方式的某个镜像,最后执行 docker build 命令构建写好的Dockerfile 成镜像。

Dockerfile基础命令-FROM

功能为指定基础镜像,并且必须是第一条指令。

如果不以任何镜像为基础,写法为:FROM scratch。

同时意味着接下来所写的指令将作为镜像的第一层开始

语法:

1
FROM [--platform=<platform>] <image> [AS <name>]

其中 是可选项,如果没有选择,那么默认值为latest

MAINTAINER

语法:

MAINTAINER 指定作者

但是这个命令已经被废弃掉了,大家如果想增加作者信息啥的,可以使用 LABEL。

Dockerfile基础命令-LABEL

功能是为镜像指定标签

语法:

1
LABEL <key>=<value>

一个Dockerfile种可以有多个LABEL,如下:

1
2
3
4
5
6
7
LABEL "com.example.vendor"="ACME Incorporated"

LABEL com.example.label-with-value="foo"

LABEL version="1.0"

LABEL description="This text illustrates that label-values can span multiple lines."

但是并不建议这样写,最好就写成一行,如太长需要换行的话则使用\符号

如下:

1
2
3
LABEL multi.label1="value1" \
multi.label2="value2" \
other="value3"

注意:LABEL会继承基础镜像种的LABEL,如遇到key相同,则值覆盖

Dockerfile基础命令-RUN

功能为运行指定的命令

RUN命令有两种格式

1
2
RUN shell脚本
RUN ["可执行文件", "参数1", "参数2", ...]

第一种后边直接跟shell命令

在linux操作系统上默认 /bin/sh -c

第二种是类似于函数调用。

可将executable理解成为可执行文件,后面就是两个参数。

两种写法比对:

1
2
3
RUN /bin/bash -c 'source $HOME/.bashrc; echo $HOME

RUN ["/bin/bash", “-c”, “echo hello”]

注意:多行命令不要写多个RUN,原因是Dockerfile中每一个指令都会建立一层. RUN书写时的换行符是 \ 多少个RUN就构建了多少层镜像,会造成镜像的臃肿、多层,不仅仅增加了构件部署的时间,还容易出错。

Dockerfile基础命令-ADD

一个复制命令,把文件复制到镜像中

如果把虚拟机与容器想象成两台linux服务器的话,那么这个命令就类似于scp,只是scp需要加用户名和密码的权限验证,而ADD不用

语法如下:

1
ADD <src>... <dest>

可以是一个本地文件或者是一个本地压缩文件,还可以是一个url
路径的填写可以是容器内的绝对路径,也可以是相对于工作目录的相对路径

1
2
3
4
5
6
7
8
9
ADD test1.txt test1.txt

ADD test1.txt test1.txt.bak

ADD test1.txt /mydir/

ADD data1 data1

ADD zip.tar /myzip

有如下注意事项:

1、如果源路径是个文件,且目标路径是以 / 结尾, 则docker会把目标路径当作一个目录,会把源文件拷贝到该目录下。如果目标路径不存在,则会自动创建目标路径。

2、如果源路径是个文件,且目标路径不是以 / 结尾,则docker会把目标路径当作一个文件。

3、如果目标路径不存在,会以目标路径为名创建一个文件,内容同源文件;

4、如果目标文件是个存在的文件,会用源文件覆盖它,当然只是内容覆盖,文件名还是目标文件名。

5、如果目标文件实际是个存在的目录,则会源文件拷贝到该目录下。 注意,这种情况下,最好显示的以 / 结尾,以避免混淆。

6、如果源路径是个目录,且目标路径不存在,则docker会自动以目标路径创建一个目录,把源路径目录下的文件拷贝进来。如果目标路径是个已经存在的目录,则docker会把源路径目录下的文件拷贝到该目录下。

7、如果源文件是个归档文件(压缩文件),则docker会自动帮解压。尽量不要把写成一个文件夹,如果是一个文件夹了,复制整个目录的内容,包括文件系统元数据

Dockerfile基础命令-COPY

复制命令

语法如下:

1
2
3
COPY …

COPY ["",… “”]

与ADD的区别, COPY的只能是本地文件,其他用法一致

Dockerfile基础命令-VOLUME

可实现挂载功能,可以将内地文件夹或者其他容器种得文件夹挂在到这个容器种

语法为:

1
VOLUME ["/data"]

说明:

[“/data”]可以是一个JsonArray ,也可以是多个值。所以如下几种写法都是正确的

1
2
3
4
5
VOLUME ["/var/log/"]

VOLUME /var/log

VOLUME /var/log /var/db

一般的使用场景为需要持久化存储数据时, 容器使用的是AUFS,这种文件系统不能持久化数据,当容器关闭后,所有的更改都会丢失,所以当数据需要持久化时用这个命令。

Dockerfile基础命令-EXPOSE

格式:

1
EXPOSE <port> [<port>/<protocol>...]

说明:

1
2
EXPOSE 80
EXPOSE 80/udp

功能为暴漏容器运行时的监听端口给外部

EXPOSE 指令实际上并不发布端口。它作为一种文档,给构建 dockerfile 的人和使用镜像的人去看的。所以不管 EXPOSE 设置如何,我们都可以在运行时使用 -p 标志覆盖它们。

Dockerfile基础命令-WORKDIR

WORKDIR 指令为 Dockerfile 中任何 RUN、CMD、ENTRYPOINT、COPY 和 ADD 指令设置工作目录。

语法:

1
WORKDIR /usr/bin/

这个 WORKDIR 类似于 cd 命令。

Dockerfile基础命令-ENV

ENV 指令用于设置环境变量的值,存储方式为 k-v 形式。

语法有两种

1
2
ENV key1 value1
ENV key1=value1 key2=value2 ...

说明:

1
2
3
ENV name=lemon123
ENV age=15 phone=18512341234
ENV company xxxx有限责任公司

两者的区别就是第一种是一次设置一个,第二种是一次设置多个
通过 ENV 设置的环境变量,我们也可以通过 docker inspect 查看这些内容,而且启动的时候还可以通过 docker run –env key=value 改变他们。

注意点:

当镜像被运行生成容器后,这些被 ENV 定义的环境变量是保持不变的。

Dockerfile基础命令-CMD

功能为容器启动时要运行的命令

语法有三种写法

1
2
3
4
5
CMD [“executable”,“param1”,“param2”]

CMD [“param1”,“param2”]

CMD command param1 param2

第三种比较好理解了,就时shell这种执行方式和写法

第一种和第二种其实都是可执行文件加上参数的形式

举例说明两种写法:

1
2
3
CMD [ “sh”, “-c”, “echo $HOME

CMD [ “echo”, “$HOME” ]

注意:

1、这里边包括参数的一定要用双引号,就是 “ 不能是单引号, 原因是参数传递后,docker解析的是一个JSON Array

2、不要把RUN和CMD搞混了。

RUN:是构件容器时就运行的命令以及提交运行结果

CMD:是容器启动时执行的命令,在构件时并不运行

Dockerfile基础命令-ENTRYPOINT

功能是启动时的默认命令

语法如下:

1
2
3
ENTRYPOINT [“executable”, “param1”, “param2”]

ENTRYPOINT command param1 param2

如果从上到下看到这里的话,那么你应该对这两种语法很熟悉啦。

第一种就是可执行文件加参数

第二种就是写shell

与 CMD 比较说明:

相同点:

只能写一条,如果写了多条,那么只有最后一条生效,容器启动时才运行,运行时机相同

不同点:

ENTRYPOINT 不会被运行的 command 覆盖,而 CMD 则会被覆盖

如果我们在 Dockerfile 时同时写了 ENTRYPOINT 和 CMD ,并且 CMD 指令不是一个完整的可执行命令,那么CMD 指定的内容将会作为 ENTRYPOINT 的参数, 如下:

1
2
3
FROM centos
ENTRYPOINT ["top", "-b"]
CMD ["-c"]

如果我们在 Dockerfile 种同时写了 ENTRYPOINT 和 CMD ,并且 CMD 是一个完整的指令,那么它们两个会互相覆盖,谁在最后谁生效, 如下:

1
2
3
FROM centos
ENTRYPOINT ["top", "-b"]
CMD ls -al

那么将执行 ls -al , top -b 不会执行

Dockerfile 实战演练

1、创建目录,用于存放 dockerfile 所使用的文件
2、在此目录中创建 dockerfile 文件
3、在此目录中使用 docker build 创建镜像
4、使用创建的镜像启动容器

准备启动文件

1
2
3
4
vim httpd-run.sh
#!/bash
rm -rf /run/httpd/*
exec /usr/sbin/httpd -D FOREGROUND

准备网页测试文件

1
2
vim index.html
hello welcome to mnqz

准备 dockerfile 文件

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
FROM centos:latest

MAINTAINER "mnqz admin@163.com"

ADD httpd-run.sh /httpd-run.sh

ADD index.html /var/www/html/index.html

RUN yum -y install httpd && chmod -v +x /httpd-run.sh

EXPOSE 80

WORKDIR /

CMD ["/bin/bash","/httpd-run.sh"]

创建镜像

1
docker build -t centos-httpd:v1 .

-t: 镜像的名字及标签,通常 name:tag 或者 name 格式

定义基础镜像 FROM

1
FROM centos

定义作者 MAINTAINER

1
MAINTAINER BaiShuming

上传文件到容器 COPY or ADD

COPY 从当前目录复制文件到容器. 只是单纯地复制文件. 格式为 COPY
ADD 从当前目录复制文件到容器. 会自动处理目录, 压缩包等情况.格式为 ADD

1
ADD nginx-1.17.6.tar.gz /root

生成镜像时运行的命令 RUN

shell 写法

1
RUN yum -y install pcre-devel zlib-devel openssl lsof iproute net-tools gcc make

exec写法

1
["命令","命令选项","参数"]

解压压缩文件

1
RUN ["tar","xf","nginx-1.17.6.tar.gz"]

创建管理用户www

1
RUN useradd -r -s/sbin/nologin -M www

进入nginx源码文件WORKDIR

1
WORKDIR /root/nginx-1.17.6

安装nginx

1
RUN ./configure --prefix=/usr/local/nginx --user=www --group=www && make && make install

定义变量 ENV

1
ENV PATH /usr/local/nginx/sbin:$PATH

业务初始化

COPY 从当前目录复制文件到容器. 只是单纯地复制文件. 格式为 COPY

1
2
COPY nginx.conf /usr/local/nginx/conf
COPY index.html /usr/local/nginx/html

输出端口 EXPOSE

1
EXPOSE 80

挂载本地目录VOLUME

创建一个可以从本地主机或其他容器挂载的挂载点
一般用来存放数据库和需要保持同步的数据

1
VOLUME ["/data"]

容器启动后执行的命令 CMD

只能执行一个,如果有多个,同一时间只有最后一个生效

1
CMD ["nginx","-g","daemon off;"]