本文主要是介绍WARING:root:GBK-EUC-H,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
**
PDFminer3k解析pdf文件错误记录:WARING:root:GBK-EUC-H
PDFminer3k解析pdf文件报错信息:
WARNING:root:Cannot locate objid=17108
WARNING:root:GBK-EUC-H
WARNING:root:UniGB-UTF16-H
查询信息发现是字体原因
下载相应的字体包
https://github.com/SkyFishers/pdfminer.six
解压后找到pdfminer/cpm/GBK-EUC-H.pickle.gz和pdfminer/cpm/UniGB-UTF16-H.pickle.gz
将文件复制到python安装目录".\Lib\site-packages\pdfminer\cmap"下
运行后报一下cid错误,这是因为没有GBK-EUC-H和UniGB-UTF16-H相关的解码包;
解决措施:到cmap中找到相关的解码包,复制到python安装目录下.\Lib\site-packages\pdfminer\cmap
之后就能正常解析中文了!
这篇关于WARING:root:GBK-EUC-H的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!