Dockerfile自定义镜像详细教程and实战演练
镜像可以看成是由多个镜像层叠加起来的一个文件系统(通过UnionFS与AUFS文件联合系统实现),镜像层也可以简单理解为一个基本的镜像,而每个镜像层之间通过指针的形式进行叠加。
根据上图,镜像层的主要组成部分包括镜像层 ID、镜像层指针 「指向父层」、元数据「 Layer Metadata,包含了 Docker 构建和运行的信息和父层的层次信息」。只读层和读写层「Top Layer」的组成部分基本一致,同时读写层可以转换成只读层「 通过docker commit 操作实现」。
元数据(metadata)就是关于这个层的额外信息,它不仅能够让Docker获取运行和构建时的信息,还包括父层的层次信息。需要注意,只读层和读写层都包含元数据。
每一层都包括了一个指向父层的指针。如果一个层没有这个指针,说明它处于最底层。
在docker主机中镜像层(image layer)的元数据被保存在名为”json”的文件中,一个容器的元数据好像是被分成了很多文件,但或多或少能够在/var/lib/docker/containers/目录下找到,就是一个可读层的id。这个目录下的文件大多是运行时的数据,比如说网络,日志等等。
镜像是一堆只读层的统一视角,除了最底层没有指向外,每一层都指向它的父层。统一文件系统( Union File System)技术能够将不同的层整合成一个文件系统,为这些层提供了一个统一的视角,这样就隐藏了多层的存在。在用户的角度看来,只存在一个文件系统。镜像每一层都是不可写的,都是只读层。
我们可以看到镜像包含多个只读层,它们重叠在一起。除了最下面一层,其它层都会有一个指针指向下一层。这些层是Docker内部的实现细节,并且能够在docker主机的文件系统上访问到。统一文件系统(union file system,升级版为AUFS)技术能够将不同的层整合成一个文件系统,为这些层提供了一个统一的视角,这样就隐藏了多层的存在,在用户的角度看来,只存在一个文件系统。
Dockerfile 是由一系列命令和参数构成的脚本,这些命令应用于基础镜像并最终创建一个新的镜像。它们简化了从头到尾的流程并极大的简化了部署工作。Dockerfile 从 FROM 命令开始,紧接着跟随着各种方法,命令和参数。其产出为一个新的可以用于创建容器的镜像。
Dockerfile 语法由两部分构成,注释和命令+参数,注释是不能少的,因为明天可能就忘记写的是什么了。说白了, Dockerfile 是告诉 docker 怎么样制作一个镜像,就像我们写代码告诉应用怎么执行一条逻辑,这样应该好理解了,所以可以在 Dockerfile 中写明,我们需要怎么个执行方式的某个镜像,最后执行 docker build 命令构建写好的Dockerfile 成镜像。
功能为指定基础镜像,并且必须是第一条指令。
如果不以任何镜像为基础,写法为:FROM scratch。
同时意味着接下来所写的指令将作为镜像的第一层开始
语法:
1 | FROM [--platform=<platform>] <image> [AS <name>] |
其中 是可选项,如果没有选择,那么默认值为latest
语法:
MAINTAINER 指定作者
但是这个命令已经被废弃掉了,大家如果想增加作者信息啥的,可以使用 LABEL。
功能是为镜像指定标签
语法:
1 | LABEL <key>=<value> |
一个Dockerfile种可以有多个LABEL,如下:
1 | LABEL "com.example.vendor"="ACME Incorporated" |
但是并不建议这样写,最好就写成一行,如太长需要换行的话则使用\符号
如下:
1 | LABEL multi.label1="value1" \ |
注意:LABEL会继承基础镜像种的LABEL,如遇到key相同,则值覆盖
功能为运行指定的命令
RUN命令有两种格式
1 | RUN shell脚本 |
第一种后边直接跟shell命令
在linux操作系统上默认 /bin/sh -c
第二种是类似于函数调用。
可将executable理解成为可执行文件,后面就是两个参数。
两种写法比对:
1 | RUN /bin/bash -c 'source $HOME/.bashrc; echo $HOME |
注意:多行命令不要写多个RUN,原因是Dockerfile中每一个指令都会建立一层. RUN书写时的换行符是 \ 多少个RUN就构建了多少层镜像,会造成镜像的臃肿、多层,不仅仅增加了构件部署的时间,还容易出错。
一个复制命令,把文件复制到镜像中
如果把虚拟机与容器想象成两台linux服务器的话,那么这个命令就类似于scp,只是scp需要加用户名和密码的权限验证,而ADD不用
语法如下:
1 | ADD <src>... <dest> |
1 | ADD test1.txt test1.txt |
有如下注意事项:
1、如果源路径是个文件,且目标路径是以 / 结尾, 则docker会把目标路径当作一个目录,会把源文件拷贝到该目录下。如果目标路径不存在,则会自动创建目标路径。
2、如果源路径是个文件,且目标路径不是以 / 结尾,则docker会把目标路径当作一个文件。
3、如果目标路径不存在,会以目标路径为名创建一个文件,内容同源文件;
4、如果目标文件是个存在的文件,会用源文件覆盖它,当然只是内容覆盖,文件名还是目标文件名。
5、如果目标文件实际是个存在的目录,则会源文件拷贝到该目录下。 注意,这种情况下,最好显示的以 / 结尾,以避免混淆。
6、如果源路径是个目录,且目标路径不存在,则docker会自动以目标路径创建一个目录,把源路径目录下的文件拷贝进来。如果目标路径是个已经存在的目录,则docker会把源路径目录下的文件拷贝到该目录下。
7、如果源文件是个归档文件(压缩文件),则docker会自动帮解压。尽量不要把
复制命令
语法如下:
1 | COPY … |
与ADD的区别, COPY的只能是本地文件,其他用法一致
可实现挂载功能,可以将内地文件夹或者其他容器种得文件夹挂在到这个容器种
语法为:
1 | VOLUME ["/data"] |
说明:
[“/data”]可以是一个JsonArray ,也可以是多个值。所以如下几种写法都是正确的
1 | VOLUME ["/var/log/"] |
一般的使用场景为需要持久化存储数据时, 容器使用的是AUFS,这种文件系统不能持久化数据,当容器关闭后,所有的更改都会丢失,所以当数据需要持久化时用这个命令。
格式:
1 | EXPOSE <port> [<port>/<protocol>...] |
说明:
1 | EXPOSE 80 |
功能为暴漏容器运行时的监听端口给外部
EXPOSE 指令实际上并不发布端口。它作为一种文档,给构建 dockerfile 的人和使用镜像的人去看的。所以不管 EXPOSE 设置如何,我们都可以在运行时使用 -p 标志覆盖它们。
WORKDIR 指令为 Dockerfile 中任何 RUN、CMD、ENTRYPOINT、COPY 和 ADD 指令设置工作目录。
语法:
1 | WORKDIR /usr/bin/ |
这个 WORKDIR 类似于 cd 命令。
ENV 指令用于设置环境变量的值,存储方式为 k-v 形式。
语法有两种
1 | ENV key1 value1 |
说明:
1 | ENV name=lemon123 |
两者的区别就是第一种是一次设置一个,第二种是一次设置多个
通过 ENV 设置的环境变量,我们也可以通过 docker inspect 查看这些内容,而且启动的时候还可以通过 docker run –env key=value 改变他们。
注意点:
当镜像被运行生成容器后,这些被 ENV 定义的环境变量是保持不变的。
功能为容器启动时要运行的命令
语法有三种写法
1 | CMD [“executable”,“param1”,“param2”] |
第三种比较好理解了,就时shell这种执行方式和写法
第一种和第二种其实都是可执行文件加上参数的形式
举例说明两种写法:
1 | CMD [ “sh”, “-c”, “echo $HOME” |
注意:
1、这里边包括参数的一定要用双引号,就是 “ 不能是单引号, 原因是参数传递后,docker解析的是一个JSON Array
2、不要把RUN和CMD搞混了。
RUN:是构件容器时就运行的命令以及提交运行结果
CMD:是容器启动时执行的命令,在构件时并不运行
功能是启动时的默认命令
语法如下:
1 | ENTRYPOINT [“executable”, “param1”, “param2”] |
如果从上到下看到这里的话,那么你应该对这两种语法很熟悉啦。
第一种就是可执行文件加参数
第二种就是写shell
与 CMD 比较说明:
相同点:
只能写一条,如果写了多条,那么只有最后一条生效,容器启动时才运行,运行时机相同
不同点:
ENTRYPOINT 不会被运行的 command 覆盖,而 CMD 则会被覆盖
如果我们在 Dockerfile 时同时写了 ENTRYPOINT 和 CMD ,并且 CMD 指令不是一个完整的可执行命令,那么CMD 指定的内容将会作为 ENTRYPOINT 的参数, 如下:
1 | FROM centos |
如果我们在 Dockerfile 种同时写了 ENTRYPOINT 和 CMD ,并且 CMD 是一个完整的指令,那么它们两个会互相覆盖,谁在最后谁生效, 如下:
1 | FROM centos |
那么将执行 ls -al , top -b 不会执行
1、创建目录,用于存放 dockerfile 所使用的文件
2、在此目录中创建 dockerfile 文件
3、在此目录中使用 docker build 创建镜像
4、使用创建的镜像启动容器
准备启动文件
1 | vim httpd-run.sh |
准备网页测试文件
1 | vim index.html |
准备 dockerfile 文件
1 | FROM centos:latest |
创建镜像
1 | docker build -t centos-httpd:v1 . |
-t: 镜像的名字及标签,通常 name:tag 或者 name 格式
定义基础镜像 FROM
1 | FROM centos |
定义作者 MAINTAINER
1 | MAINTAINER BaiShuming |
上传文件到容器 COPY or ADD
COPY 从当前目录复制文件到容器. 只是单纯地复制文件. 格式为 COPY
ADD 从当前目录复制文件到容器. 会自动处理目录, 压缩包等情况.格式为 ADD
1 | ADD nginx-1.17.6.tar.gz /root |
生成镜像时运行的命令 RUN
shell 写法
1 | RUN yum -y install pcre-devel zlib-devel openssl lsof iproute net-tools gcc make |
exec写法
1 | ["命令","命令选项","参数"] |
解压压缩文件
1 | RUN ["tar","xf","nginx-1.17.6.tar.gz"] |
创建管理用户www
1 | RUN useradd -r -s/sbin/nologin -M www |
进入nginx源码文件WORKDIR
1 | WORKDIR /root/nginx-1.17.6 |
安装nginx
1 | RUN ./configure --prefix=/usr/local/nginx --user=www --group=www && make && make install |
定义变量 ENV
1 | ENV PATH /usr/local/nginx/sbin:$PATH |
业务初始化
COPY 从当前目录复制文件到容器. 只是单纯地复制文件. 格式为 COPY
1 | COPY nginx.conf /usr/local/nginx/conf |
输出端口 EXPOSE
1 | EXPOSE 80 |
挂载本地目录VOLUME
创建一个可以从本地主机或其他容器挂载的挂载点
一般用来存放数据库和需要保持同步的数据
1 | VOLUME ["/data"] |
容器启动后执行的命令 CMD
只能执行一个,如果有多个,同一时间只有最后一个生效
1 | CMD ["nginx","-g","daemon off;"] |