博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hive基本操作与应用
阅读量:6103 次
发布时间:2019-06-20

本文共 459 字,大约阅读时间需要 1 分钟。

启动hadoop

1
start
-
all
.sh
1
jps

  

Hdfs上创建文件夹

1
2
hdfs dfs 
-
mkdir wcinput
hdfs dfs 
-
ls 
/
usr
/
hadoop

 

上传文件至hdfs

1
2
hdfs dfs 
-
put .
/
515.txt 
wcinput
hdfs dfs 
-
ls 
/
usr
/
hadoop
/
wcinput

 

启动Hive

1
hive

  

创建原始文档表

1
create table docs(line string);

  

导入文件内容到表docs并查看

1
load data inpath 
'/user/hadoop/wcinput/515.txt' 
overwrite into table docs;

 

1
select 
* 
from 
docs;

  

用HQL进行词频统计,结果放在表word_count里

 

查看统计结果

转载于:https://www.cnblogs.com/BOXczx/p/9049178.html

你可能感兴趣的文章
8个3D视觉效果的HTML5动画欣赏
查看>>
C#如何在DataGridViewCell中自定义脚本编辑器
查看>>
【linux】crontab定时命令
查看>>
Android UI优化——include、merge 、ViewStub
查看>>
Office WORD如何取消开始工作右侧栏
查看>>
Android Jni调用浅述
查看>>
CodeCombat森林关卡Python代码
查看>>
第一个应用程序HelloWorld
查看>>
(二)Spring Boot 起步入门(翻译自Spring Boot官方教程文档)1.5.9.RELEASE
查看>>
Android Annotation扫盲笔记
查看>>
React 整洁代码最佳实践
查看>>
聊聊架构设计做些什么来谈如何成为架构师
查看>>
Java并发编程73道面试题及答案
查看>>
iOS知识小集·设置userAgent的那件小事
查看>>
移动端架构的几点思考
查看>>
Tomcat与Spring中的事件机制详解
查看>>
Spark综合使用及用户行为案例区域内热门商品统计分析实战-Spark商业应用实战...
查看>>
初学者自学前端须知
查看>>
Retrofit 源码剖析-深入
查看>>
企业级负载平衡简介(转)
查看>>