博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
NLP自然语言处理学习笔记二(初试)
阅读量:6933 次
发布时间:2019-06-27

本文共 926 字,大约阅读时间需要 3 分钟。

前言:
用Python对自然语言处理有很好的库。它叫 。下面就是对NLTK的第一尝试。
安装:
1.安装Pip
比较简单,得益于CentOS7自带的easy_install。执行一行命令就可以搞定。
*在终端控制台->easy_install pip
 
2.检验Pip是否可用
 
Pip是Python的包管理工具。我们运行Pip确定CentOS下可用。
*在终端控制台->pip -V 注意参数大小写
3.使用Pip安装NLTK
*在终端控制台->pip install -U nltk
NLTK使用:
完成安装后我们可以在Python的解释器里试验一下。当然在命令行形式(command line)下的解析器里编写Python确实有些不爽。下一节会推荐好用的Python IDE (集成开发环境)给大家。稍安勿躁哦。我们还是先来第一个小实验吧。
*在终端控制台->Python 进入Python解释器(command line)->print("hello python")
*继续输入->import nltk->nltk.download()
*下载我们需要的预料库按l键来浏览列表(回车进行翻页)。我们需要下载的是book标记的预料库作为我们的第一个小实验的数据。
 
 
*下载book语料库数据。按d键然后输入book回车。等待下载,下载完成可以按l键看看都安装了那些数据。后按q键退出。
 
 
按L键,看看那些预料被安装了。回车翻页。
第一个小实验搜索
 
现在可以可以开始第一个小实验了,按照书上的范例我们搜索《白鲸记》中的词monstrous。当然这本书已经包含在我们刚才下载的预料数据里了。
*导入nltk.book的预料库->from nltk.book import *->text1 便打印出了《白鲸记》
*找出monstrous这个词很简单只需要使用concordance这个函数就可以了。是不是很简单。
 
一共出现在了11处位置,并且显示了出现这个词的上下文。到现在为止我们已经开启了NLP学习的大门。是不是很激动呢。让我们一起努力吧。

转载于:https://www.cnblogs.com/SunlightQiu/p/5979501.html

你可能感兴趣的文章
CI类实现session基本用法
查看>>
Kubelet源码分析(一):启动流程分析
查看>>
Ktor 1.0发布:JetBrains推出的Kotlin Web框架
查看>>
杠上Spark、Flink?Kafka为何转型流数据平台
查看>>
Ruby 2.2.0发布,支持增量式垃圾收集和符号的垃圾收集
查看>>
使用Rekit开发可扩展的前端应用
查看>>
android源码分析-深入MessageQueue
查看>>
苹果裁撤自动驾驶项目员工200余人
查看>>
红帽OpenShift总经理谈容器技术需要关注的方向
查看>>
组合使用Laravel和vfsStream测试文件上传
查看>>
微软发布Azure Application Insights for Node.js 1.0版本
查看>>
前端实例练习 - 动效按钮
查看>>
Java 20年:JVM虚拟化技术的发展
查看>>
Azure Service Fabric正式发布
查看>>
唐文:挖掘产品生命周期潜藏的商业价值——应用性能管理
查看>>
迅雷“星域”打通最后一公里重新定义CDN
查看>>
专访Matt Klein关于在Lyft构建Envoy的问答
查看>>
Intuit的Alex Balazs访谈
查看>>
Java社区领袖介绍平台支持选项
查看>>
JFinal整合Shiro(二)
查看>>