火车采集器V9标签组合功能怎么用?这些情况要注意

火车采集器V9版本增加了新的功能,使获取网页信息更加方便。用户能够利用标签的搭配来选取数据,这种使用方式十分方便,接下来我们具体讲解一下。

功能基本介绍

火车采集器V9把标签组合功能设置在数据获取方式选项中,可以借助标签组合来获取标签数据,这让数据获取方式多了一种新选择,在抓取网页数据时更加方便灵活。

使用注意点一

标签组合用于确定文件下载前的信息。部分用户注意到,a标签用于文件下载时,其显示的原始地址与下载完成后的地址不一致。当在b标签中整合a标签时,a标签所包含的是原始地址。这是由于文件下载发生在标签组合完成之后。如果希望标签内容反映文件下载结束后的状态,可以创建一个新的“自定义固定格式数据”标签,将标签组合的结果放入其中,替换操作将在文件下载过程结束后进行。

内容页的标签会不断收集并变成新的条目。如果搭配的两个标签都是内容页的标签,会根据数量最多的记录来制造同样数量的新记录。如果某个标签的数量少,新产生的标签中那个标签的值会是空的。比如标签a的数量是5,标签b的数量是3,组合后产生的标签c会有5个,前3个的值分别是a和b,后两个是空的b值。

列表页的标记和内容页的标记结合在一起。如果这两个标记一个是内容页标记一个是列表页标记,内容页标记会参与循环处理,列表页标记先当作文本处理。合并之后程序再进行数据操作,组合标记中的列表页标记内容会被换成具体数据,组合完成的结果还可以提取并下载。

已有标签组合示例

图片[1]-火车采集器V9标签组合功能怎么用?这些情况要注意-东山笔记

我们先尝试组合已存在的标签。将“标题”和“来源”这两个标签拼接成“标题___来源”的形式。接着查看这个新标签里的内容,发现测试数据和我们的设想相符。这表明这种组合方法相当稳定,能够让资料整理变得更加简单。

图片[2]-火车采集器V9标签组合功能怎么用?这些情况要注意-东山笔记

固定格式数据组合

尝试用不同的方法来生成固定格式的数据,之后可以发现,这种做法和之前跟已有标签结合的方式得到的结果是一样的,这说明不论采用哪种结合方法,火车采集器V9都能很好地达到我们的要求。

使用火车采集器V9的标签组合功能,有没有碰到过什么麻烦事呢?可以在评论区说说自己的经历,如果觉得文章写得还行,就动动手指点个赞,顺便转发一下。

图片[3]-火车采集器V9标签组合功能怎么用?这些情况要注意-东山笔记

© 版权声明
THE END
喜欢就支持一下吧
分享