使用Hive导出csv
大家在导出csv后,使用Excel大家文件的时候,会遇到这样的问题,文件的存在少量串行的数据,虽然不影响整体数据,但是有的时候遇到高精度计算的过程中,还是难免有些尴尬😅
- 导出的时候进行转义
- 导出的时候使用其他格式,在Excel中使用 数据->文件->自文本导入 使用自定义格式导入
- 使用Hive序列化导入,会自动规整格式
1
2
3
4
5
6
7
8
9
10
11
12
13CREATE TABLE wys.wys_output
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
"separatorChar" = ",",
"quoteChar" = "\"",
"escapeChar" = "\""
)
STORED AS TEXTFILE
as select
distinct
a,
b
from xxx;
Excel中csv格式中会出现\n 使用rtrim和ltrim可以去除,每一列数据都是以"
分割数据,但是在数据出现"
号的话就会导致数据串行,此时我们可以使用""
来代表那是数据中双引号