Docker 包含三个基本概念

  • 镜像(Image
  • 容器(container
  • 仓库(Repository

镜像

Docker 镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数(如匿名卷、环境变量、用户等)。镜像不包含任何动态数据,其内容在构建之后也不会被改变。对比 Linux,Docker 镜像相当于 Linux 中的root文件系统。

因为镜像包含操作系统完整的 root 文件系统,其体积往往是庞大的,因此在 Docker 设计时,就充分利用 Union FS 的技术,将其设计为分层存储的架构。所以严格来说,镜像并非是像一个 ISO 那样的打包文件,镜像只是一个虚拟的概念,其实际体现并非由一个文件组成,而是由一组文件系统组成,或者说,由多层文件系统联合组成。

镜像构建时,会一层层构建,前一层是后一层的基础。每一层构建完就不会再发生改变,后一层上的任何改变只发生在自己这一层。比如,删除前一层文件的操作,实际不是真的删除前一层的文件,而是仅在当前层标记为该文件已删除。在最终容器运行的时候,虽然不会看到这个文件,但是实际上该文件会一直跟随镜像。因此,在构建镜像的时候,需要额外小心,每一层尽量只包含该层需要添加的东西,任何额外的东西应该在该层构建结束前清理掉。

分层存储的特征还使得镜像的复用、定制变的更为容易。甚至可以用之前构建好的镜像作为基础层,然后进一步添加新的层,以定制自己所需的内容,构建新的镜像。

容器

镜像是静态的运行环境而容器则是镜像运行时的实体,其本质上是一个进程并拥有自己的命名空间,使用起来就像是一个独立的、隔离于宿主的运行环境。

和镜像一样,容器同样采用分层存储。容器运行时以镜像为基础层并在其上创建一个当前容器的存储层,即容器存储层。容器存储层的生存周期和容器一样,容器消亡时,容器存储层也随之消亡。任何保存于容器存储层的信息都会随容器删除而丢失,因此,容器不应该向其存储层写入任何数据,容器存储层要保持无状态化。所有的文件写入操作,都应该使用数据卷(Volume)、或者绑定宿主目录(bind),在这些位置的读写会跳过容器存储层,直接对宿主(或网络存储)发生读写,其性能和稳定性更高。

数据卷的生存周期独立于容器,使用数据卷可以保证容器删除或重新运行时数据不会丢失。

仓库

**Docker Registry **是 Docker 用来存储、分发镜像的服务。类似于 Github,Docker 官方提供的远程存储服务为 Docker Hub,除此之外,Red Hat 提供了 Quay.io,Google 提供了 Google Container Registry。利用这些 Docker Registry 服务,我们就可以远程上传和下载镜像了。