sqoop介绍与安装

sqoop介绍与安装

1 概述

sqoop是Apache旗下的一款“hadoop和关系型数据库服务器之间传送数据”的工具。

导入数据:将关系型结构化数据如MySQL,oracle数据导入到hadoop的hdfs、hive、hbase的数据存储系统。

导出数据:从hadoop的文件系统中导出数据到关系型数据库。

2 工作机制

将导入导出命令解析成MapReduce程序来实现,解析出的MapReduce中主要是对inputformat和outputformat进行定制。

3 sqoop安装

安装sqoop的前提是已经具备java和hadoop的环境。

3.1 下载并解压

最新版下载地址

http://ftp.wayne.edu/apache/sqoop/1.4.6/

3.2 修改配置文件

$ cd $SQOOP_HOME/conf
$ mv sqoop-env-template.sh sqoop-env.sh
# 打开sqoop-env.sh并编辑下面几行:
export HADOOP_COMMON_HOME=/soft/hadoop-2.6.1/ 
export HADOOP_MAPRED_HOME=/soft/hadoop-2.6.1/
export HIVE_HOME=/soft/hive-1.2.1

3.3 加入mysql的jdbc驱动包

可以从hive的lib中拷贝MySQL驱动到sqoop的lib目录下。
cp /soft/hive/lib/mysql-connector-java-5.1.28.jar $SQOOP_HOME/lib
如果没有mysql的驱动的话需要自己到Apache官网去下载。

3.4 验证启动

输入$sqoop version命令如果成功应该显示如下信息:
<pre>
15/12/17 14:52:32 INFO sqoop.Sqoop: Running Sqoop version: 1.4.6
Sqoop 1.4.6 git commit id 5b34accaca7de251fc91161733f906af2eddbe83
Compiled by abe on Fri Aug 1 11:19:26 PDT 2015
</pre>

OK! 到这里sqoop的安装已经完成。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1、运行环境 主机IP 主机名 2、配置主机名(分别在五台机器上执行) hostname +主机名例如: h...
    献给记性不好的自己阅读 8,927评论 0 6
  • 1/列出mysql数据库中的所有数据库sqoop list-databases -connect jdbc:mys...
    时待吾阅读 7,645评论 1 5
  • 1.大数据协作框架: 大数据协作框架是Hadoop 2.x生态系统中几个辅助框架。最为常见的是以下几个: 数据转换...
    奉先阅读 8,260评论 0 2
  • Apache Sqoop 概述 使用Hadoop来分析和处理数据需要将数据加载到集群中并且将它和企业生产数据库中的...
    和心数据阅读 5,114评论 0 8
  • *iOS8.3以后 plist文件中 UIFileSharingEnabled 置为 false 可以让ap...
    cuagain阅读 1,924评论 0 0