无忧启动论坛

 找回密码
 注册
搜索
系统gho:最纯净好用系统下载站投放广告、加入VIP会员,请联系 微信:wuyouceo
查看: 13510|回复: 30
打印 上一主题 下一主题

[发布] 文件编码格式转换器encodeconv2.0(命令行工具)

  [复制链接]
跳转到指定楼层
1#
发表于 2019-8-26 10:18:12 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 liuzhaoyzz 于 2019-12-29 19:33 编辑

文件编码格式转换器encodeconv2.0(命令行工具)

作者: 游蓝海 主页: http://blog.csdn.net/you_lan_hai 日期: 2013.9.18

https://github.com/youlanhai/encodeconv

原作者:游蓝海,liuzhaoyzz修改,源文件编码自动检测,静态编译不需要什么运行库。
https://www.cnblogs.com/liuzhaoyzz/p/11392294.html
修改后的exe文件只有164KB,源代码也一起分享出来。https://share.weiyun.com/58H0Ii2
https://gitee.com/liuzhaoyzz/encodeconv

目前支持的编码格式有: gbk,big5,utf-7,utf-8,ucs2,ucs-2le,ucs-2be。当然支持其他编码格式也很容易。

用法: encodeconv -f fname [-o][output file] [-s][src encode] [-d][dest encode] [-nb] encodeconv -f fname [-o][output file] [-s] [-d][dest encode] [-nb]   
[src encode]设为auto则会自动检测源文件编码格式。

encodeconv -p path filter [-r] [-o][output path] [-s][src encode] [-d][dest encode] [-nb]

-f: 要转换的是一个文件。

-p: 对目录中的文件进行编码转换。此时必须提供过滤器(filter),以判断哪些文件需要转换。使用-r参数,可以递归到子目录。

filter: 文件扩展名过滤器,多个扩展名时,中间用分号隔开。 如: txt;h;cpp

-r: 对子目录也进行转换.

-o: 输出文件或路径。

-s: 源文件编码格式, auto,gbk,big5,utf-7,utf-8,ucs2,ucs-2le,ucs-2be,auto=自动检测。

-d: 目标文件编码格式,默认utf-8。

-nb: 不给文件头追加bom标示。

例如,

转换一个文件: encodeconv -f test.txt -o test2.txt -s gbk -d utf-8

源文件编码自动检测:encodeconv -f test.txt -o test2.txt -s auto -d utf-8

转换一个目录下的所有文件: encodeconv -p c:/test/ txt;h;cpp -o d:/test/ -s gbk -d utf-8 -r


test.rar

75.3 KB, 下载次数: 113, 下载积分: 无忧币 -2

评分

参与人数 1无忧币 +5 收起 理由
freesoft00 + 5

查看全部评分

2#
 楼主| 发表于 2019-8-26 10:18:19 | 只看该作者
本帖最后由 liuzhaoyzz 于 2019-8-26 11:01 编辑

百度了下,没找到合适的。
linux平台下的iconv,我就没有成功过。
在批处理之家找到tmplinshi版主写的concmd在有些PE下无法运行,因为需要语言文件的支持,不知道倒底需要什么语言文件支撑。
于是在github上面搜索了下,找到了一楼的,原项目不支持自动检测文件编码,还需要dll文件支持,有的PE下面跑不起来,于是我修改了源代码,加入了自动检测文件编码,用VS2010静态编译。github我上传不了,不研究了。源代码直接发网盘算了。
exe文件很小,只要164KB。

顺便吐槽下批处理之家,附件限制只有50KB,50KB能干啥啊!

点评

批处理之家硬盘容量很小,所以对附件做了限制。  详情 回复 发表于 2019-8-26 12:07
回复

使用道具 举报

3#
发表于 2019-8-26 10:57:16 | 只看该作者
版版辛苦了
回复

使用道具 举报

4#
发表于 2019-8-26 11:46:51 | 只看该作者
感谢
我前2天正好需要一个自动检测源文件的编码的工具
找了半天没找到
今天居然就发现楼主分享了一个
太好了
回复

使用道具 举报

5#
发表于 2019-8-26 12:07:30 | 只看该作者
liuzhaoyzz 发表于 2019-8-26 10:18
百度了下,没找到合适的。
linux平台下的iconv,我就没有成功过。
在批处理之家找到tmplinshi版主写的con ...

批处理之家硬盘容量很小,所以对附件做了限制。

点评

硬盘这么便宜,批处理之家太抠门了。  发表于 2019-8-27 08:35
回复

使用道具 举报

6#
发表于 2019-8-26 13:35:22 | 只看该作者

点评

来晚了,没看到你分享出的地址。有支持命令行的版本吗?如果有,能够实现一楼的功能,我就不用造轮子了。。。  详情 回复 发表于 2019-8-26 14:00
回复

使用道具 举报

7#
 楼主| 发表于 2019-8-26 14:00:11 | 只看该作者
本帖最后由 liuzhaoyzz 于 2019-8-26 14:03 编辑


        来晚了,没看到你分享出的地址。有支持命令行的版本吗?如果有,能够实现一楼的功能,我就不用重复造轮子了。。。
回复

使用道具 举报

8#
发表于 2019-8-26 14:29:20 | 只看该作者
在WINDOWS 下没用过这东西,以前在MAC在有一个这种软件,因为有些编码在MAC下会乱码。
回复

使用道具 举报

9#
发表于 2019-8-26 20:18:41 | 只看该作者
没Ansi编码么

点评

gbk和big5就是ansi本地编码。  详情 回复 发表于 2019-8-27 08:26
回复

使用道具 举报

10#
发表于 2019-8-26 20:31:19 | 只看该作者


还没有写命令行及写文件的功能。

点评

请在你的原帖子分享下载地址。谢谢。源代码可愿意分享?  详情 回复 发表于 2019-8-27 08:28
回复

使用道具 举报

11#
 楼主| 发表于 2019-8-27 08:26:42 | 只看该作者

        gbk和big5就是ansi本地编码。

点评

转成GBK时 回车换行 没有换成习惯的双字节 OD OA,而是用原本的OA 所以,以为不支持ANSI  详情 回复 发表于 2019-8-27 18:35
回复

使用道具 举报

12#
 楼主| 发表于 2019-8-27 08:28:58 | 只看该作者
chishingchan 发表于 2019-8-26 20:31
还没有写命令行及写文件的功能。

        请在你的原帖子分享下载地址。谢谢。源代码可愿意分享?
回复

使用道具 举报

13#
发表于 2019-8-27 18:35:33 | 只看该作者
liuzhaoyzz 发表于 2019-8-27 08:26
gbk和big5就是ansi本地编码。

转成GBK时 回车换行 没有换成习惯的双字节 OD OA,而是用原本的OA
所以,以为不支持ANSI
回复

使用道具 举报

14#
发表于 2019-8-27 18:39:02 | 只看该作者
回复

使用道具 举报

15#
发表于 2019-10-26 21:10:02 | 只看该作者
版版辛苦了
回复

使用道具 举报

16#
发表于 2019-11-6 23:55:50 | 只看该作者
这个软件很不错的,支持楼主了
回复

使用道具 举报

17#
发表于 2021-4-23 09:22:55 | 只看该作者
wimlib-imagex info install.wim  --extract-xml 10.xml
encodeconv -f 10.xml -s auto -o 10.txt -d GBK
srcEncode:ucs-2le
error: convert '10.xml' to '10.txt' failed! code:6

点评

我也搞不清楚原因,原理和算法都是原作者的,希望有高手继续研究。  详情 回复 发表于 2021-4-25 16:25
回复

使用道具 举报

18#
 楼主| 发表于 2021-4-25 16:25:30 来自手机 | 只看该作者
szwp 发表于 2021-4-23 09:22
wimlib-imagex info install.wim  --extract-xml 10.xml
encodeconv -f 10.xml -s auto -o 10.txt -d GBK
...

        我也搞不清楚原因,原理和算法都是原作者的,希望有高手继续研究。
回复

使用道具 举报

19#
发表于 2021-4-27 00:01:13 | 只看该作者
版版辛苦了
回复

使用道具 举报

20#
发表于 2022-1-11 11:12:00 | 只看该作者
本帖最后由 bSH 于 2022-1-11 11:15 编辑

不错,比较小巧的命令行工具!赞!
如果能兼容通配符(*  ?)就更好了!

程序需要的目标参数 -e,程序提示有,但你的用法说明(本贴及附件说明txt)没有提到,可以补充一下!
不过这个-e参数从逻辑或者方便性来说有点小问题,一般转换编码文件扩展名都不变,但这里并不能省略…
..
我也来一个例子——把程序同文件夹下的所有(任意编码)txt文件编码转换为UTF-8,文件名不变:
encodeconv -p %cd% txt -o %cd% -e txt -s auto -d utf-8


点评

处理某些文件类型的文件,可以用cmd里面的for遍历,自己实现,我的c语言水平很差劲。  详情 回复 发表于 2022-1-11 11:44
bSH
@liuzhaoyzz  详情 回复 发表于 2022-1-11 11:18
回复

使用道具 举报

21#
发表于 2022-1-11 11:18:21 | 只看该作者
bSH 发表于 2022-1-11 11:12
不错,比较小巧的命令行工具!赞!
如果能兼容通配符(*  ?)就更好了!

@liuzhaoyzz
回复

使用道具 举报

22#
 楼主| 发表于 2022-1-11 11:44:58 | 只看该作者
bSH 发表于 2022-1-11 11:12
不错,比较小巧的命令行工具!赞!
如果能兼容通配符(*  ?)就更好了!

处理某些文件类型的文件,可以用cmd里面的for遍历,自己实现,我的c语言水平很差劲。        
回复

使用道具 举报

23#
发表于 2023-7-30 18:03:21 | 只看该作者
这个软件很不错的,支持楼主了
回复

使用道具 举报

24#
发表于 2023-8-1 10:12:54 | 只看该作者
感谢分享 支持下
回复

使用道具 举报

25#
发表于 2023-9-4 16:21:47 | 只看该作者
谢谢分享
回复

使用道具 举报

26#
发表于 2023-11-18 22:41:54 | 只看该作者
源文件编码自动检测

这个软件自动检测编码是如何做到的?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|捐助支持|无忧启动 ( 闽ICP备05002490号-1 )

闽公网安备 35020302032614号

GMT+8, 2024-11-22 09:38

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表