文本挖掘的基本流程

发布时间：2021-02-25 13:40:17 所属栏目：大数据来源：网络整理

导读：一、获取文本 ??我们获取网络文本，主要是获取网页HTML的形式。我们要把网络中的文本获取文本数据库(数据集)。编写爬虫（Spider）程序,抓取到网络中的信息。可以用广度优先和深度优先；根据用户的需求，爬虫可以有垂直爬虫和通用爬虫之分，垂直爬取主要是在

（编辑：文山站长网）