private String initBookEncode(FileInputStream fileInputStream) {
String encode = "gb2312";
try{
byte[] head = new byte[3];
fileInputStream.read(head);
if(head[0]==-17 && head[1]==-69 && head[2] ==-65)
encode = "UTF-8";
else if (head[0] == -1 && head[1] == -2 )
encode = "UTF-16";
else if (head[0] == -2 && head[1] == -1 )
encode = "Unicode";
}catch (IOException e) {
Log.e(Global.TAG, "can't get book encoding:"+e.getMessage());
}
return encode;
}
分享到:
相关推荐
如果很多时候我们没有约定好文件格式,我们就难以读取文件内容,此时,我们就需要一个工具来探测所读文本的编码格式,此工具可以允许用户读取诸如utf-8,gbk,gb2312一类的文件格式。内置了一些常用的探测实现类,...
识别文本文件的编码格式。 有时我们在处理文本文件时,对其编码要求有一定要求,但一般情况下并不知道此文件的编码格式,就如同一个 MXL文件,它的标识为: 但是,这并不代表它的文件编码就是 "UTF-8"。 利用这个,...
描述:此工具是用来获取某个目录下的文本文件编码.它依赖于java,在命令下运行.所以运行前必须安装java,配置java环境可以使用path变量,也可以到FileEncoding文件里面配也可以.这工具是基于cpdetector项目,它检查文件的...
这是一个获取文本的工具类,支持utf8,gbk等等格式的编码。对应位置编码格式的文件使用该工具类便可以获取文件工具类
以下是获取文件编码的一个类: .../// 获取文件的编码格式 /// public class EncodingType { /// /// 给定文件的路径,读取文件的二进制数据,判断文件的编码类型 /// /// <param name=FILE_N
NChardet文本文件编码探测库源码,C#,txt文件编码自动探测 用于自动探测TXT文本文件编码,支持GB2312、UTF-8、ASCII等几乎所有主流编码的探测,使用方法如下: static public Encoding GetEncoding(string bookPath...
代码工具类,可以用java代码区分文本文档的编码,非常实用
java工具jar文件 获取文件的编码格式 例如UTF-8,GBK,UTF-16,GB2312等等
利用chardet,cpdetector包获取文件格式,并判断文件类型是否带BOM
解决txt文件隐藏码获取文本编码失效问题。通过该方法可以直接获取文本编码,根据文本的编码解析文本
(包括ANSI、UNICODE、UNICODE big endian、UTF-8)格式的文本文件 */ //核心算法:CStdioFileEx继承自CStdioFile, 覆盖CStdioFile的 BOOL ReadString(CString& rString)方法, // 根据不同文件编码特征,寻找文件...
关于功能5修改编码格式——写该功能主要因为,经常遇到一些文本文件由于编码格式不一致的问题,导致无法用写好的算法进行读取。 对于该功能需要注意的是,编码格式不能写错,请在使用前先备份,写错有可能导致文件被...
C#+读取文本文件+字符编码
实验目的:理解哈弗曼信源编码算法,并能应用于文件压缩中。 实验内容:写出程序,利用哈弗曼编码实现对文件...(1) 从压缩文件中获得原始文件各字节及出现的次数,并根据此构造哈弗曼对照表; (2) 将压缩文件中对应
主要介绍了java获取文件编码,jsoup获取html纯文本操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
给大家带来一款功能强大的批量文本提取器,该软件非常不错,当前支持支持正则表达式,批量提取文本,可以将HTML等文件中指定内容存入数据库、HTML、文本文件,存入数据库的意思是将提取的文本内容直接导入进数据库中...
光是看扩展名是无法知道影片的正确的编码格式的,特别像DivX这样的高品质、高压缩比的影片格式出现后。除了原本未压缩的AVI影片外,目前使用这样的扩展名格式影就还有DivX、XviD等等,而使用AVIcodec来检测影片的...
MediaInfo(绿色中文版)用来分析视频和音频文件的编码和内容信息,检测视频编码信息,把目前几个主流的CODEC viewer的功能都给包进来了.像是对新格式的支持, 提供相关CODECs和播放软件的网页连结等等 使用MediaInfo...