wget中文无乱码带IRI编译版本(32bit)
Posted | archive
最近Google Code慢得跟狗屎一样,然后svn export
或者svn checkout
遇到大量文件,中途失败一下就悲剧了,因为没法断点续传。(或者我不知道)
然后svn用代理也很sb,google的那个代理貌似不支持HTTP OPTIONS这种svn需要的语法,所以我就只有很悲剧的用wget -m
了
折腾了一下发现wget -m
这玩意很很sb,居然不支持中文URL或文件名。好吧,发现wget支持两个参数
--local-encoding=ENC use ENC as the local encoding for IRIs.
--remote-encoding=ENC use ENC as the default remote encoding.
满怀欣喜的用着两个参数 =UTF-8 的运行,结果发现
This version does not have support for IRIs
卧槽啊卧槽, 于是自己弄源码编译,已经都--with-libidn
了,结果这JB烂玩意儿只能随机处理一个或两个中文字符,UTF-8尼玛伤不起啊!
最后用了cocobear的patch,搞定了中文URL和文件名的问题,顺利wget -m
来下载Google Code的一个SVN。
以前折腾sftpd发现中文路径要挂,记得也是源码里只处理32-127的ASCII。
为了节省大家的时间,提供一个编译好的32bit wget ELF文件下载:
Comments