nltk的全称是natural language toolkit是一套基于python的自然语訁处理工具集。自带语料库、词性分类库、自带分类分词等功能、强大社区支持、很多简单版wrapper
例如像社交网络上的表情、字符等tokensize后就会出錯 -》 利用正则表达式
停止词:一千个the会指代一千个事如果引入的话会造成很大的歧义 -- 从nltk.corpus中import stopwords -- 如果是判断有木有语病、文章相似度高不高,則不能去除停止词
自然语言 ----》特征工程 --》计算机识别的01
情感分析 ~广告投放中
七月在线NLP课程的资源内含代码、视频、课件等资源。
0 | 0 |
为了良好体验不建议使用迅雷下载
会员到期时間: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
为了良好体验不建议使用迅雷下载
0 | 0 |
为了良好体验,不建议使用迅雷下载
您的积分不足将扣除 10 C币
为了良好体验,不建议使用迅雷下载
开通VIP会员权限免积分下载