PlanoTse求职自动化/响应手册

PlanoTse求职自动化手册
数据项类型	响应	XML案例研究

响应数据持有者

PlanoTse是一个用于挖掘全球数据的个人工具。这意味着网页搜索自动化。它的一种应用是在求职自动化中。PlanoTse中的数据类型之一是响应。它是一个数据持有者，用于保存原始和派生的网页数据。响应和脚本是PlanoTse中两种最重要的数据持有者类型。

在网页搜索中，浏览器上显示的每个网页都称为HTTP响应。当您输入网页地址并要求浏览器转到该地址时，您会发出一个HTTP请求。在网页搜索自动化中，会自动生成许多HTTP请求，并且许多HTTP响应（即检索到的网页）会从各种Web服务器发送回给您。作为网页搜索自动化流程的一部分，PlanoTse对每个返回的网页执行以下步骤

如何处理HTTP响应

创建一个响应数据持有者，将其存储为XML文件。例如，Response12345.xml，其中12345是数据持有者的ID号。
将网页内容存储在HTML文件中，例如Response12345.htm。
将网页上找到的所有无用链接存储在XML文件中，例如Response12345.RemovedLinks。
将网页上找到的所有有用文本和链接存储在HTML文件中，例如Response12345.txt。
等等。

响应 - 数据项集合

对于特定的数据域，所有响应持有者都存储在同一个集合目录下，其名称为Responses。此目录位于MyData（对于个人域）或OurData（对于非个人域）下。当然，所有这些都位于数据根目录下，如菜单命令[工具 » 目录 » 数据根目录]中所知。

响应附件文件夹

每个响应持有者的名称为Response12345.xml，其中12345是持有者编号。附带有一组数据项附件。数据项的所有附件都存储在数据项文件夹中。

PlanoTse求职自动化手册
数据项类型	响应	XML案例研究