![大数据技术入门(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/475/34752475/b_34752475.jpg)
上QQ阅读APP看书,第一时间看更新
2.9 AWS云平台上安装Hadoop
安装Hadoop的最简单的方法就是使用云平台(例如AWS)的Hadoop服务。EMR是AWS的Hadoop服务。下面阐述安装和配置EMR的步骤。从服务菜单中选择EMR,点击“create cluster”,如图2-27所示,填入集群名字,选择要安装的Hadoop的各个组件。我们选择了Hadoop和Spark。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P67_3959.jpg?sign=1739288523-1GaGyOZFjOSQg5uv471OT0qmnvfYqPi9-0-0db4ec1b3ec4b0a12b83bda83b6a0b71)
图2-27 创建Hadoop集群
如图2-28所示,指定Hadoop集群的硬件设置。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4004.jpg?sign=1739288523-CGIFW5o5MecRZHaibrJ2KRwvyqn6Jjas-0-c548baf5d1841fa1a6e1dea5ffec00e3)
图2-28 硬件配置
设置Hadoop集群的网络和安全设置。单击如图2-29所示的安全组的配置,就出现如图2-30所示的设置。然后,使用SSH登录到AWS的Master节点,就会出现如图2-31所示的界面,而后就可以输入Spark命令。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4005.jpg?sign=1739288523-yb8pEg151kPu18vtMnWiJR7ZmQLg606g-0-2ca2fb594a3af62900d29760bdd2b6a0)
图2-29 网络和安全设置
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4006.jpg?sign=1739288523-xMuBIeItnxFbFEOIhqa3raOUhzgfIWDO-0-9d609b8584a6f2c2fe2723d1c7bd7999)
图2-30 安全组设置
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4007.jpg?sign=1739288523-hHAY1oUgnDuNNTG49CBFf7WtI9H9X6nu-0-2637663936407f5da82922a8f4a94ea7)
图2-31 Spark界面
除了使用SSH来操作Hadoop集群和Spark之外,还可以在如图2-32所示的界面中启动Zeppelin,随后就会出现如图2-33所示的界面。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4051.jpg?sign=1739288523-UwKkNQOTEtvYwM9cRxToAXCVDriAwL1V-0-9623caaf0039b6c3c87e25c86b0b94a3)
图2-32 集群
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4052.jpg?sign=1739288523-pBQi8hSNFTVJ4Ahjr7uJfZLiWOIW1v6h-0-9b277e9daf73fc7a0fa048defcbdff3c)
图2-33 Zeppelin
之后,就可以输入Spark语句来操作集群上的数据(见图2-34,),查看日志信息(见图2-35)。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4053.jpg?sign=1739288523-W77sycXOMsxaZX7GvQxy7CVj1whTxHMo-0-8f54e31528a358451be365eda0891710)
图2-34 Spark操作
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4054.jpg?sign=1739288523-Sf1kmaftTxpLApPpa7WjcQYzKX3IKr5i-0-e978db7c372e4aef06cfa84913fe50a2)
图2-35 查看日志