在AWS EMR上,Hive默认使用的端口是10000。要在AWS EMR上使用Hive,您需要将相应的端口打开,以便能够访问Hive的Web用户界面和执行Hive查询。
以下是在AWS EMR上设置Hive端口的步骤和示例代码:
- 登录到AWS管理控制台并导航到EMR服务。
- 点击“创建集群”并选择EMR版本和硬件配置。
- 在“软件配置”步骤中,选择要包含在集群中的应用程序,确保选择了Hive。
- 在“安全和访问”步骤中,选择“创建并选择现有的IAM角色”。
- 在“网络”步骤中,选择您的VPC和子网配置。
- 在“核心和任务节点”配置中,选择实例类型和数量。
- 在“引导操作”步骤中,为集群选择适当的引导操作。
- 完成配置并启动集群。
一旦集群启动,您可以通过以下步骤在AWS EMR上访问Hive:
- 打开AWS管理控制台,导航到EMR服务并选择您的集群。
- 在集群摘要页面,找到“Master public DNS”字段并记录下来。
- 使用SSH工具(如PuTTY)连接到Master节点的公共DNS。
ssh -i hadoop@
- 运行以下命令以启动Hive:
hive
- 这将启动Hive CLI(命令行界面)。
- 在Hive CLI中,您可以执行Hive查询。
请注意,上述示例假定您已经具有适当的AWS EMR集群和配置,并且已经设置了与集群相关的安全组和IAM角色。