跳转至内容

PlanoTse求职自动化/响应手册

来自Wikibooks,开放世界中的开放书籍
PlanoTse求职自动化手册
数据项类型 响应 XML案例研究

响应数据持有者

[编辑 | 编辑源代码]

PlanoTse是一个用于挖掘全球数据的个人工具。这意味着网页搜索自动化。它的一种应用是在求职自动化中。PlanoTse中的数据类型之一是响应。它是一个数据持有者,用于保存原始和派生的网页数据。响应和脚本是PlanoTse中两种最重要的数据持有者类型。

网页搜索中,浏览器上显示的每个网页都称为HTTP响应。当您输入网页地址并要求浏览器转到该地址时,您会发出一个HTTP请求。在网页搜索自动化中,会自动生成许多HTTP请求,并且许多HTTP响应(即检索到的网页)会从各种Web服务器发送回给您。作为网页搜索自动化流程的一部分,PlanoTse对每个返回的网页执行以下步骤

如何处理HTTP响应
  1. 创建一个响应数据持有者,将其存储为XML文件。例如,Response12345.xml,其中12345是数据持有者的ID号。
  2. 将网页内容存储在HTML文件中,例如Response12345.htm
  3. 将网页上找到的所有无用链接存储在XML文件中,例如Response12345.RemovedLinks
  4. 将网页上找到的所有有用文本和链接存储在HTML文件中,例如Response12345.txt
  5. 等等。

响应 - 数据项集合

[编辑 | 编辑源代码]

对于特定的数据域,所有响应持有者都存储在同一个集合目录下,其名称为Responses。此目录位于MyData(对于个人域)或OurData(对于非个人域)下。当然,所有这些都位于数据根目录下,如菜单命令[工具 » 目录 » 数据根目录]中所知。

响应附件文件夹

[编辑 | 编辑源代码]

每个响应持有者的名称为Response12345.xml,其中12345是持有者编号。附带有一组数据项附件。数据项的所有附件都存储在数据项文件夹中。

PlanoTse求职自动化手册
数据项类型 响应 XML案例研究
华夏公益教科书