Hive利用HDFS存储数据,利用MapReduce查询数据
Hive能将数据文件映射成为一张表,在hive中能够写sql处理的前提是针对表,而不是针对文件,因此需要将文件和表之间的对应关系描述记录清楚。映射信息专业的叫法称为元数据信息(元数据是指用来描述数据的数据)。元数据存储在关系型数据库中
Hive能将数据文件映射成为一张表,这个映射是指文件和表之间的对应关系
Hive软件本身承担了SQL语法解析编译成为MapReduce
hive的架构图如下所示
HIve组件及其功能
Metastore即元数据服务。metastore服务的作用是管理metastore元数据。
metastore配置方式
内嵌模式、本地模式、远程模式
hive的安装部署
如果学习的是黑马的教程,可以跳过第一步Hadoop与hive的整合,来到第二步MySQL的安装
mysql只需要在一台机器安装并需要授权远程访问