摘要:序最近需要搭建多虚拟机模拟集群来运行平台我又重新翻开了之前的使用笔记重新整理后发了上来搭建虚拟机主要使用和两个软件通常情况如果建立服务器环境的虚拟机我使用否则使用考虑到任务主要是运行平台并不需要桌面环境要尽可能节省资源又考虑到的开源免费跨平
序live with scope
最近需要搭建多虚拟机模拟集群来运行Spark平台, 我又重新翻开了之前的VritualBox使用笔记, 重新整理后发了上来.
搭建虚拟机主要使用VirtualBox和VMware两个软件. 通常情况, 如果建立服务器环境的虚拟机, 我使用VirtualBox, 否则使用VMware.
考虑到任务主要是运行Spark平台, 并不需要桌面环境, 要尽可能节省资源. 又考虑到VirtualBox的开源, 免费, 跨平台以及提供命令行管理, 我选择使用VirtualBox来搭建需要的虚拟机集群.但就我的使用体验来看, VMware建立的虚拟机往往拥有更好的性能和更强的功能,
这里除了建立第一个虚拟机的过程需要使用图形化, 其余过程全部使用命令行. 主要考虑到真实的工作可能并没有桌面环境.
这里也不是搭建大数据平台的教程, 只是在过程中如何使用VirtualBox命令行来管理虚拟机.
任务要求需求: 5个虚拟机, 其中2个master, 3个worker.
因为要建立5个虚拟机, 不可能将安装镜像重复性的安装5次, 可以考虑将一个安装完全后, 通过克隆来复制成5个. 但这样的做法并不适合将建立的虚拟机传给别人. 这里使用虚拟机的导出和导入.
新虚拟机的建立不细说, 但有几点注意:
用户名和密码请设置为hadoop
将相关软件存储在/opt目录
在/etc/bash.bashrc文件设置相关环境变量和PATH路径
安装VirtualBox好吧, 这应该不算作一个问题, 在Windows平台上. 但如果宿主机是Linux, 特别是Ubuntu时, Oracle提供有PPA方便安装.
添加deb http://download.virtualbox.org/virtualbox/debian trusty contrib到软件源文件, 或者在/etc/apt/sources.list.d目录下新建文件写入.
获取官方的软件源校验密钥wget -q https://www.virtualbox.org/download/oracle_vbox.asc -O- | sudo apt-key add -
更新本地缓存并安装sudo apt-get update && sudo apt-get install virtualbox-5.0
网络选择和操作默认情况下, VirtualBox建立的虚拟机网络默认NAT. 虚拟机之间无法沟通, 虚拟机能连接主机和外部网络, 但主机不能访问虚拟机(可以通过端口转发来访问虚拟机). 对于大数据平台, 虚拟机之前的数据传递是必要的, 因此不能使用NAT.
别的网络选项, 如Bridged networking, 桥接网络, 会将虚拟机添加到主机所在的局域网. 不好的是, 外部网络也能连接到虚拟机, 对虚拟机的安全不利. 而Host-only, 主机网络, 则是虚拟机只能与主机彼此连接, 但不能访问外部网络. 虚拟机更新和安装软件, 总有连网的需求.
VirtualBox提供了实验性质的NAT Service, 虚拟机之间可以彼此连接, 虚拟机可以访问外部网络, 但主机要通过端口转发来访问虚拟机.
添加NAT服务网络:
vboxmanage natnetwork add --netname big_data --network "192.168.2.0/24" --enable
添加选项--dhcp on可以开启DHCP动态IP分配. 但虚拟机之间由于要配置主机名到IP的映射, DHCP可能会改变虚拟机的IP(大部分情况下不会). 因此, 这里并不开启DHCP.
对NAT服务网络的操作:
vboxmanage natnetwork [start|stop|remove] --netname big_data
现在假设建立的虚拟机名为spark, 更改其网络设置为natnetwork.
vboxmanage modifyvm spark --nic1 natnetwork --nat-network1 big_data #关机执行 vboxmanage modifyvm spark --nic1 nat vboxmanage controlvm spark nic1 natnetwork --nat-network big_data #开机执行 vboxmanage controlvm spark nic1 nat
这里是最无语的地方. 也请记住, modifyvm子命令只能在关机状态下执行, 而controlvm则只能在开机状态下执行. 像更换网络和设置端口转发, 在GUI界面是同样的操作, 在命令行下就不同了. 蛋疼!!!
导入和导出导出这个基本配置完成的虚拟机:
vboxmanage export spark -o spark.ova --ovf20 --options manifest, nomacs --vsys 0 --product "enalix"s spark vm" --version "1.0"
ovf是一种虚拟机共享协议, 用于将虚拟机导出生成多个文件, --ovf20最新的标准. ova文件格式实际上是对ovf的多个文件以tar打包成单个文件以方便传输. 一个ova文件可以包含多个虚拟机, 因此, 如果要添加虚拟机的产品名和版本等别的额外信息, 需要指定针对哪个虚拟机, 由--vsys n来指定. 从0索引. manifest用于导出文件在导入时检验. nomacs是除去虚拟机的mac地址信息. 在正常的导出和克隆时, mac是不变的, 在同一网络中, 相同mac的虚拟机是无法通信的. 因此这里选择除去mac信息, 在导入时会自动生成新的不同的地址.
生成ova格式的文件就可以进行传输了. 其实创建虚拟机也有命令行vboxmanage createvm, 再加上一些选择来控制. 但虚拟机的安装过程, 需要选择语言, 地区, 键盘, 用户等等, 这些可以使用Ubuntu Preseeding文件来预先写上答案来自动化安装. 这是另一篇文章的内容了, 如何自动化安装系统. 这里可以在一台桌面环境的系统安装配置完成后, 导出生成ova文件, 再传输到别的电脑上导入.
导入虚拟机:
vboxmanage import spark.ova -n #列出可更改选项 vboxmanage import spark.ova --vsys 0 --vmname spark_master1 --memory 1024 --unit xx --disk path
导入时还有更多的控制选项, 如禁用声卡, 磁盘控制器, CPU数等. 但更主要的是, 虚拟机名, 和磁盘路径. 这里的--vsys 0同上相同. 虚拟机由不同的单元组成, --unit xx指定用于改变哪个单元. 你可能需要导入多次来建立多个虚拟机名.
控制虚拟机启动虚拟机:
vboxmanage startvm vm1 vm2 ... --type headless
可以同时启动多个虚拟机. VirtualBox提供有多种启动方式, 由于是非桌面环境, 因此可以使用headless来无窗口地启动. 换句话说, 虚拟机确实启动了, 你可以从主机ssh登录, 但并不会有某个窗口在运行虚拟机.
VirtualBox提供了虚拟机组管理机制, 你可以将相关的虚拟机添加到一个组中.
vboxmanage modify spark_master1 --group "/bigdata" #入组 vboxmanage modify spark_master1 --group "" #退组
但是无语的是, 虽然GUI界面的VirtualBox提供有组启动, 但命令行并没有. 你只能在一条启动命令中列出要启动的多个虚拟机名. 另一个无语的是, 无法一条命令将多个虚拟机添加到同一组. 真不明白这种简单方便的选项怎么没提供.
除了启动外, 你还有更多的控制:
VBoxManage controlvm vmname [poweroff|reset|pause|resume|acpipowerbutton|acpisleepbutton|savestate]
这里面有一些区别. poweroff实际上相当于拔电源, reset相当于硬件的重置. 而acpipowerbutton才是系统的关机, acpisleepbutton则是系统的休眠. 注意, 休眠应该是Windows独享的功能. pause和resume则是暂停和恢复虚拟机. savestate会保存当前状态并关机.
端口转发由于是无窗口的启动虚拟机, 因此在主机通过ssh登录管理系统则是非常必要的. 这里通过端口转发来完成.
vboxmanage natnetwork modify --netname bigdata --port-forward-4 "master1:tcp:[]:2010:[192.168.2.10]:22" vboxmanage natnetwork modify --netname bigdata --port-forward-4 delete master1
此处建立了一条端口转发的规则master1, 协议tcp, 从主机2010端口到虚拟机192.168.2.10的22端口. 这里的--port-forward-4是指IPv4版本的.
有意思的是, 无论是添加nat服务网络, 而是添加服务网络的端口转发, 都只能在命令行中进行. GUI是不提供此功能的. 而事实上, GUI的管理工具只提供些简化的功能, 如果要完全掌握VirtualBox, 仍然需要探索命令行.
对于一般的NAT网络来说, 也可以设置端口转发:
vboxmanage modifyvm spark_master1 --natpf1 "master1,tcp,,2222,,22" #关机执行 vboxmanage modifyvm spark_master1 --natpf1 delete master1 vboxmanage controlvm spark_master1 nic1 nat --natpf1 "master1,tcp,,2222,,22" vboxmanage controlvm spark_master1 nic1 nat --natpf1 delete master1
设置中, 连续的两个,表示此处为空. 在NAT网络下, 虚拟机只和主机相连, 因此主机的IP和虚拟机的IP并不重要, 可省略. nic1和natpf1中是数字1, 表示多网卡情况下对网卡的选择. 即使只有单一网卡, 也要写1.
好了, 你可以从主机登录虚拟机进行管理了, 设置好正确的/etc/hostname, /etc/hosts, /etc/network/interface等文件. 并生成ssh密钥以实现无密码登录, 等等. 这是另一篇内容了, 如何搭建spark平台.
快照管理创建快照: VBoxManage snapshot vmname take snapname [--description desc] [--live],有--live参数,快照创建过程中不会停止虚拟机.
删除快照: VBoxManage snapshot vmname delete snapname
恢复快照: VBoxManage snapshot vmname restore snapname
恢复到当前快照: VBoxManage snapshot vmname restorecurrent
列出快照: VBoxManage snapshot vmname list [--details]
编辑快照: VBoxManage snapshot vmname edit snapname [--name
列出所有(运行)的虚拟机: vboxmanage list vms|runningvms
列出支持的虚拟系统类型: vboxmanage list ostypes
显示虚拟机的详细信息: vboxmanage showvminfo vm_name
给虚拟机重命名: vboxmanage modifyvm vm_name --name new_name
快照管理: vboxmanage snapshot vm_name take/delete/restore snap_name, 创建/删除/恢复快照.
删除虚拟机及相关文件: VBoxManage unregistervm test --delete
后记最开始我是计划使用vagrant, 如果你读过之前的介绍vagrant的文章, 应该知道它可以生成一个box格式的文件, 很方便再生成新的虚拟机. 但有几点让我不舒服.
1, vagrant似乎不能改变虚拟机名, 默认的虚拟机名是字串加上随机数字. 这也就意味着你不能通过虚拟机名来管理虚拟机. 只能不断切换目录, 用vagrant命令. 但命令相比vboxmanage提供的功能太少.
2, vagrant建立的虚拟机, 并没有配置选项可以将网络设置成natnetwork. 而由前所述, 要建立集群, 虚拟机间的通信是必要的.
3, box格式并不是通用的格式, 这意味着, 如果用box来传输, 在对方计算机上也要安装vagrant. 你不一定有权限这样做.
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/9321.html
摘要:序言做为的爱好者表示对没有完整易用的命令行工具的平台无爱但是在长期使用中深感它的图形界面实在太糟糕了通常有三种方式来获得的体验一是平台它实现了将软件的底层调用转换为的二是安装双系统但图形界面的容错性很差经常会显示软件崩溃三是使用虚拟机在或上 showImg(https://segmentfault.com/img/bVxPyo); live with scope 序言 做为Linux的...
摘要:网址是一款基于的工具,用于创建和部署虚拟化开发环境,使用的虚拟化系统。解决了在我电脑上可以正常运行啊的情况。网址由于官网下载速度捉急,请保存到百度云自行下载到本地链接密码添加及配置下载好后,请找到在本地的路径,我的路径是。 作为一个javaweb开发者,一直使用windows作为开发系统,多少有点和行业不太匹配,对Linux开始产生兴趣,一方面想熟悉使用Linux作为后台系统做web开...
摘要:网址是一款基于的工具,用于创建和部署虚拟化开发环境,使用的虚拟化系统。解决了在我电脑上可以正常运行啊的情况。网址由于官网下载速度捉急,请保存到百度云自行下载到本地链接密码添加及配置下载好后,请找到在本地的路径,我的路径是。 作为一个javaweb开发者,一直使用windows作为开发系统,多少有点和行业不太匹配,对Linux开始产生兴趣,一方面想熟悉使用Linux作为后台系统做web开...
摘要:之后每次对配置文件进行更改时,都需要重载,重载命令。五安装宝塔面板打开宝塔面板官网,因为虚拟机用的是环境,所以我们去面板专区。在网页的最下端给出了宝塔面板的安装方法。 以前在 Windows 上搞 PHP 开发的时候用的是 wamp 或者 phpstudy 这些本地开发环境,现在转战到 Mac 后,本想着像以前一样的弄个本地开发环境,但得知了 vagrant 后,毅然决定更换开发方法。...
摘要:既然要组集群那就涉及诸如的资源调度管理等等一系列问题。目前涉及集群的三个主要的技术无外乎三种。从本文开始作者将会一一实践这几种主要的集群技术,话不多说,现在开始。完全运行于内存中,体积小,启动快。 showImg(https://segmentfault.com/img/remote/1460000015723680); 前言 相信Docker技术大家都有所了解,单个Docker能发...
阅读 5150·2021-11-24 10:25
阅读 2367·2021-11-16 11:44
阅读 3693·2021-10-11 11:09
阅读 3034·2021-09-02 15:41
阅读 3149·2019-08-30 14:14
阅读 2154·2019-08-29 14:10
阅读 2214·2019-08-29 11:03
阅读 1001·2019-08-26 13:47