Python输出结果为二进制转汉字元组,如何解码为中文汉字

功)把一个不平常的库从 Python 2 移植到 Python 3 嘚过程它 也许能帮助你;也许不能。这里存在一个相当陡的学习曲线 由于你首先需要稍微理解一下这个库,那样你才可以理解为什 么咜会损坏以及我如何修复它的围绕字符串有很多损坏的地 方。

方法见代码注释python2.x环境下,注意仅仅适用于unicode乱码情况,不适用于 类似于这种/xae的乱码情况

# #以上大列表中每个自列表代表一个文本分词后的结果 # #返回的结果中,全部都是list可以看到,corpus下标是0~8表示文本数目是9个 # #返回的list中的元祖()中,是(id,在单个文本中出现该word的次数)、 # #下面是把询问的问题转化为稀疏向量

数据集昰复旦新闻数据集其他的数据集也是可以的。

有没有方便的函数 循环的方法怎么写,并且会不会影响性能

我自己试验了一下,这样做就可以了

你对这个回答的评价是

元组是不可更改的,所谓的转化其实是新建了一个经过转化的元组吧

你对这个回答的评价是?

你对这个回答的评价是

采纳数:1 获赞数:5 LV4

你对这个回答的评价是?

下载百度知道APP搶鲜体验

使用百度知道APP,立即抢鲜体验你的手机镜头里或许有别人想知道的答案。

我要回帖

更多关于 二进制转汉字 的文章

 

随机推荐