爱晚红枫论坛·湖大人的精神家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

用新浪微博登录

只需一步,快速搞定

人人连接登陆

无需注册,直接登录

搜索
查看: 88|回复: 0
收起左侧

[经验交流] Java读取Csv实践

[复制链接]
发表于 7 天前 | 显示全部楼层 |阅读模式
  看项目中以前的处理方式是直接用用java IO类库读取Csv文件,实际处理中发现Csv文件本身包含了对各种特殊字符的处理信息。
  最常见的比如:
  1. 对包含特殊字符的字符串数据首尾加双引号
  2. 对数据中的单个双引号前加单个双引号
  其它...
  所以用Java IO读到的字符串全是经过处理后的字符串,在某些场景下是不符合预期需求的。比如我需要的是不做任何处理的原始内容。
  项目中另一种常见的文件格式Excel用了POI来处理,但是POI不支持Csv格式,于是找到了javacsv。
  代码很简单:
  Java代码
  public List importCsv(String file) {
  List list = new ArrayList();
  CsvReader reader = null;
  try {
  //初始化CsvReader并指定列分隔符和字符编码
  reader = new CsvReader(file, ',', Charset.forName("GBK"));
  while (reader.readRecord()) {
  //读取每行数据以数组形式返回
  String[] str = reader.getValues();
  if (str != null && str.length > 0) {
  if (str[0] != null && !"".equals(str[0].trim())) {
  list.add(str);
  }
  }
  }
  } catch (FileNotFoundException e) {
  log.error("Error reading csv file.",e);
  } catch (IOException e) {
  log.error("",e);
  }
  finally{
  if(reader != null)
  //关闭CsvReader
  reader.close();
  }
  return list;
  }
  以上代码有几个要点:
  1 初始化CsvReader时指定分隔符和字符编码,如果不指定,默认分别为逗号和ISO-8859-1,我用了GBK,具体使用时要看当时的字符编码而定。
  2 读取每行数据,返回字符串数组,数组内的顺序即文件数据列的顺序
  3 最后记得关闭CsvReader
  是不是很简单,返回的数组格式也正好是我想要的,而且拿到是原始的数据,没有经过特殊字符处理。
  有些童鞋质疑特殊字符未经处理,插到数据库会出错,其实大可不必我们手工处理,一些基础组件比如JDBC的preparedstatement已经包含了对特殊字符的处理,我们只要以绑定参数的形式来传送这些包含特殊字符的数据就可以。常用的持久化框架底层也封装了JDBC,自然也对特殊字符做了处理。如有不懂的朋友可以加我Q,或者加群号来一起学习,大家一起学习编程分享视频,希望能帮助喜欢JAVA的朋友。有需要帮助的也可以联系我。

[发帖际遇]: changshasxt使用爱晚客户端发帖交流,奖励3 EXP 经验. 幸运榜 / 衰神榜
深邃的内心,自由自我。爱晚红枫论坛欢迎你。改动个人签名,请在“设置”/个人资料/个人信息里修改。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 人人连接登陆

本版积分规则

关闭

湖大论坛重大通知上一条 /1 下一条

投诉反馈|小黑屋|手机版|爱晚红枫学生网 ( 湘ICP备12012320号-2   

GMT+8, 2017-10-18 00:50 , Processed in 0.098161 second(s), 17 queries , Gzip On, Memcache On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表